Maszyna zaczyna wreszcie rozumieć po ludzku

Kim jest Rachmaninow? Czym jest albinizm? Kim jest Judy? - takimi odpowiedziami Watson utorował sobie drogę do zwycięstwa w specjalnym wydaniu popularnego teleturnieju Jeopardy!, zostawiając w tyle dwóch arcymistrzów telewizyjnego programu. Dodajmy, że Watson, to komputer. I to bez dostępu do internetu.

Dzisiaj, gdy potrzebujemy informacji na jakiś temat lub chcemy sprawdzić znaczenie nieznanego słowa, niemal odruchowo zwracamy się o pomoc do wujka Google'a, kontaktując się z nim za pośrednictwem komputera czy komórki. Po wpisaniu zapytania na ekranie pojawia się lista mniej lub bardziej trafnych odsyłaczy, pod którymi powinniśmy szukać odpowiedzi. A czy nie prościej byłoby po prostu zadać komputerowi pytanie i poczekać, aż odpowie nam pełnym zdaniem - tak, jakby odpowiedział nam wszechwiedzący przyjaciel?

Właśnie tak - jak kolega, który ma rozum wypchany informacjami, ma działać Watson - system komputerowy stworzony przez inżynierów firmy IBM.  Tego, że maszyna może zrozumieć najbardziej pogmatwane ludzkie pytania, Watson dowiódł podczas niezwykłej próby - telewizyjnego teleturnieju Jeopardy!, którego uczestnicy muszą się wykazać nie tylko olbrzymią wiedzą, ale także rozumieniem lingwistycznych niuansów.

Co ten człowiek ma na myśli?

Watson podczas występu w teleturnieju Jeopardy!Watson podczas występu w teleturnieju Jeopardy! Fot. IBM

Odpowiadanie na pytania - brzmi dziecinnie prosto. Jednak dla maszyny, która nie ma poczucia humoru, nie radzi sobie ze skojarzeniami czy używanymi przez nas skrótami myślowymi jest to nie lada wyzwanie, w efekcie czego czasem może ona nie odgadnąć, co człowiek miał na myśli. Z tym problemem postanowili się zmierzyć naukowcy z Centrum Badawczego IBM imienia T.J. Watsona w Hawthorne, zajmujący się tworzeniem systemów typu QA (Question and Answer - Pytanie i Odpowiedź).  "Ojcem" Watsona jest dr David Ferrucci. Jak przyznał reporterowi New York Timesa, sam nie jest zbyt wielkim fanem Jeopardy!. Jednak to właśnie za pomocą tego niezwykle popularnego za oceanem teleturnieju badacze postanowili sprawdzić możliwości nowego systemu.

Najbardziej zabawne było patrzeć, jak superkomputer prosi o pytania z kategorii 'dziewczyny mnie lubią' - przeczytaj wywiad z Davidem Ferruccim, kierownikiem projektu Watson

Jeopardy! (w Polsce przez kilka lat emitowany był podobny teleturniej o nazwie "Va Banque") jest rozrywką dla publiczności, ale raczej nie dla uczestników. Po pierwsze, wymaga olbrzymiej wiedzy z najróżniejszych dziedzin życia - od fizyki, przez historię sztuki i sportu, po politykę i tasiemcowe seriale. Ponadto, pytania nie mają formy pytań, ale... odpowiedzi. A zadaniem uczestnika jest podanie odpowiedzi w formie pytania. Na przykład, na podpowiedź prowadzącego: Ten drapieżnik jest nazywany królem zwierząt", uczestnik powinien odrzec "Czym jest lew?" - i tak dalej. Gdyby pytania były tak proste, nie byłoby problemu, ale często wskazówki prowadzącego przybierają formę szarad lub bazują na skojarzeniach. Czasem w rozwiązaniu zagadki pomocą może być nazwa kategorii - choć nie zawsze jest to takie oczywiste. Jakby tego wszystkiego było mało, uczestnicy muszą wykazać się niezwykłym refleksem, by móc udzielić odpowiedzi jako pierwszy. Mieć trochę szczęścia i nie dać się zjeść tremie.

Chyba tylko o to ostatnie nie musiał martwic się Watson, jak pieszczotliwie ochrzczono system do pytań i odpowiedzi stworzony w laboratorium IBM. Prace nad projektem DeepQA trwały cztery lata , a w pewnym momencie pojawił się pomysł współpracy z Jeopardy! Skoro komputer może grać w szachy z arcymistrzem (i go pokonać), to czemu nie mógłby się zmierzyć z mistrzami podchwytliwych zagadek?

Jak mieć właściwe skojarzenia?

Jeopardy!Jeopardy! Fot. IBM [Jeopardy!] to dobra reprezentacja naturalnego języka. By mieć szanse w grze, trzeba rozumieć język angielski, ze wszystkimi jego niuansami, regionalizmami, slangiem, skrótami - wyjaśnia Harry Friedman, producent teleturnieju.

Przygotowując Watsona do teleturnieju, jego pamięć nafaszerowano 200 milionami stron informacji zapisanych w naturalnym języku - tekstami podręczników, słowników, leksykonów, encyklopedii i powieści. Podobnie jak ludzcy uczestnicy, podczas rozgrywki Watson nie mógł korzystać z żadnej pomocy z zewnątrz (np. z zasobów internetu), a jedynie bazować na zgromadzonej w swojej pamięci wiedzy.

Do szybkiego przeszukiwania tak olbrzymiej ilości nieustrukturyzowanych danych niezbędna była odpowiednia moc obliczeniowa. Tej dostarczyło 90 serwerów IBM POWER 750 , z których każdy posiada cztery ośmiordzeniowe procesory Power7 , a także pamięć RAM o pojemności 15 terabajtów.   Wszystko to w czarnych "skrzyniach" przypominających bardziej lodówki niż domowe pecety.

Ponieważ Watson raczej nie zmieściłby się na scenie Jeopardy!, widzowie specjalnych odcinków teleturnieju, które wyemitowano w połowie lutego, mogli go zobaczyć w postaci  stojącego za pulpitem ekranu, na którym wyświetlał się animowany awatar, przypominający ni to żarówkę, ni to główkę ludzika.

Jednak surowe dane i sprzęt to nie wszystko - niezbędne jest jeszcze oprogramowanie. Watsona zaprogramowano tak, by usłyszawszy podpowiedź starał się wziąć pod uwagę kontekst (np. nazwę kategorii), a następnie przeszukiwał swoje zasoby i oceniał prawdopodobieństwo poprawności poszczególnych odpowiedzi-kandydatek. Dopiero gdy któraś była dostatecznie "pewna" , "Watson" zgłaszał się do odpowiedzi.

Do wielkiego starcia maszyny i ludzi doszło w styczniu (odcinki wyemitowano w połowie lutego), w studiu zaaranżowanym w Centrum Badawczym IBM w Hawthorne.

Teleturniej to dopiero rozgrzewka

Pierwszy dzień zakończył się remisem Watsona i Brada Ruttera, którzy zdobyli po 5 tys. dolarów. Trzeci z zawodników, Ken Jennings, dorobił się 2 tys. dolarów. Drugi dzień należał już do Watsona, który wygrał z kwota 35734 dolarów na koncie. Drugi był Rutter (10,4 tys. dol), a trzeci Jennings (4,8 tys.dol) . Dobra passa trzymała się Watsona do końca - trafiając na pytania z premiami i radząc sobie z zagadkami zadawanymi przez prowadzącego, Alexa Trebeka, superkompter  zwyciężył całą rozgrywkę z wynikiem 77147 dol. Ludzcy zawodnicy zakończyli bitwę z o wiele niższymi sumami na kontach - Jennings zdobył 24 tys. dolarów, a Rutterowi 21,6 tys. Gdy stało się jasne, ze Watson podołał zadaniu, na widowni wybuchła wrzawa, a kilkadziesiąt osób, stojących za sukcesem maszyny nie mogło powstrzymać swojej radości.

Warto jednak dodać, że Watson nie zawsze był pierwszy. Ken i Brad udzielali czasem odpowiedzi w 1-2 sekundy. Watson - mimo całej swojej mocy obliczeniowej - czasem potrzebował więcej czasu na dojście do rozwiązania. - To pokazuje, jak niezwykły jest ludzki mózg. Widzisz kategorie, słyszysz pytanie i bum! Masz odpowiedź - mówi dr Ferrucci. Watson nie tylko czasem był wolniejszy ale też nie zawsze udzielał dobrych odpowiedzi.

Oczywiście udział (i zwycięstwo) w teleturnieju nie było powodem, dla którego zbudowano Watsona.

- Tempo przyrostu informacji przewyższa nasze możliwości zrozumienia ich i ekstrahowania z nich potrzebnej wiedzy. Dlatego zdecydowaliśmy się zbudować system, który pozwalałby na wyszukiwanie wiedzy z zalewu informacji szybciej, niż potrafi to człowiek czy inne komputery - wyjaśnia  John E. Kelly III, wiceprezes IBM i szef IBM Research.

Podobne do Watsona systemy do udzielania odpowiedzi mogłyby znaleźć zastosowanie praktycznie w każdej dziedzinie życia. - od medycyny po transport. Na przykład, w medycynie, mógłby pomagać lekarzom w dopieraniu najodpowiedniejszego sposobu terapii dla danego pacjenta , zamiast stosowania uogólnionego, standardowego trybu leczenia. Tu niezwykle ważny jest element pewności systemu - tego, że wie, że coś wie, lub, ze nie jest pewny swojej informacji.

- Pomyśl o internecie. Na początku nikt nie przypuszczał, jak rozwinie się internet, jak ważnym elementem naszego życia się stanie i jak bardzo będzie przydatny. Coś takiego jak Watson daje nam podobna obietnice - nie wiesz, czym to coś może się stać w przyszłości - podkreśla Dr David Gondek, jeden z naukowców pracujących przy Watsonie. - Myślałem, ze to już koniec, a to dopiero początek.

Małgorzata Minta

Więcej o: