Google: Ludzie nam ufają

-Jeśli odnajdziesz długo poszukiwanego przyjaciela lub ważne informacje dotyczące trudnej do zdiagnozowania choroby myślisz "ale mam szczęście". I ten moment, każdy z nich kiedy najważniejsza dla Ciebie strona WWW ukazuje się jako pierwszy wynik w Google, zostaje w twojej pamięci- mówi Marissa Mayer, wiceprezes Google Inc. ds. wyszukiwania i satysfakcji użytkownika. W wywiadzie udzielonym IDG News Service, opowiada o przyszłości wyszukiwania: wyszukiwaniu uniwersalnym i wideo oraz problemach z nimi związanych. Wspomina o tym czego obawia się Google, o tym ile lat będą jeszcze trwały prace nad wyszukiwaniem oraz o tym, że firma... analizuje rozmowy głosowe.

Są różne podejścia technologiczne do wyszukiwania wideo. Na przykład firma Blinx twierdzi, że jest lepsza od Google, ponieważ dzięki wykorzystaniu technologii rozpoznawania mowy, posiada indeks tekstowy tego co jest mówione w klipach wideo. W jakim punkcie, jeśli chodzi o wyszukiwanie wideo, stoi dzisiaj Google?

Google Video rozwijało się w interesujący sposób. Przy starcie wyszukiwanie opierało się na załączonych opisach i, co ciekawe, nie można było odtwarzać wideo. Zmieniliśmy to. Dzisiaj jest możliwość odtwarzania wideo [przy wynikach wyszukiwania - przyp. red.] i przeszukiwania treści na poziomie meta. Jeden z kolejnych elementów, który prawdopodobnie pojawi się w wyszukiwaniu wideo, jest związany z rozpoznawaniem mowy.

Prawdopodobnie słyszałeś o naszej usłudze 1-800-GOOG411 [darmowa usługa telefoniczna działająca w USA - rozmówca komunikuje się głosowo z automatem by uzyskać informacje lokalne, np. o najbliższej pizzerii - przyp. red].

To czy -411 może być rentownym biznesem na razie nie jest jasne. Ja jestem dość sceptyczna. Powodem dla którego naprawdę stworzyliśmy ten system jest zbudowanie doskonałego systemu przetwarzania mowy na tekst... I ten system będzie miał bardzo wiele różnych zastosowań, także wyszukiwanie wideo.

Nasi eksperci od rozpoznawania mowy mówią: jeśli chcecie byśmy zbudowali dobry model rozpoznawania mowy, potrzebujemy jak najwięcej fonemów, czyli jak nawięcej sylab wymawianych przez szczególne głosy o szczególnej intonacji. Więc potrzebujemy wielu rozmawiających ludzi, mówiących różnorodne kwestie, żebyśmy mogli "wytrenować" nasz system. Podsumowując 1-800-GOOG411 opiera się na pozyskaniu wielu różnorodnych sampli zawierających mowę, po to by rozpoznając głos w wideo, zrobić to z jak największą dokładnością.

Marissa Mayer ma 32 lata. Do Google przystąpiła w 1999 r. i była jednym z pierwszych pracowników firmy, która dzisiaj na całym świecie zatrudnia ich kilkanaście tysięcy.

Została pierwszą kobietą na stanowisku inżynierskim w Google. Ukończyła informatykę na Uniwersytecie Stanforda.

A co z niemą treścią wideo, np. akcją?

To będzie szczególnie trudne, większość dzisiejszych rozwiązań Google bazuje na tekście. Potrzebujemy tekstu i dlatego pracujemy nad jak najlepszym modelem rozpoznawania mowy i przekształcania jej w tekst. Zgadzam się, że jest bardzo wiele sytuacji humorystycznych, takich, w których dużą rolę gra kontekst i wiele scen, które nie zawierają żadnych dialogów. I w tego typu wypadkach musimy zdać się na społeczność, która będzie na przykład "tagowała" filmy.

Badania nad rozpoznawaniem twarzy i obiektów w wideo są na bardzo wczesnym etapie. Można stwierdzić: tak, w tej klatce pokazywana jest piłka, ale to dużo za mało i za wcześnie aby to miało jakiekolwiek komercyjne zastosowanie.

Niektórzy krytykują Google za to, że analizuje zapytania ze względu na pojedyncze słowa kluczowe, a nie język naturalny, jak całe zdania.

Na dzień dzisiejszy Google naprawdę dobrze sobie radzi ze słowami kluczowymi, myślimy, że to ograniczenie powinno znikać wraz z upływem czasu. Ludzie powinni mieć możliwość zadawania pytań, a my powinniśmy mieć możliwość rozumienia tych pytań. Albo powinni mieć możliwość komunikowania się z wyszukiwarką na różnych poziomach ogólności. Otrzymujemy wiele zapytań ogólnych - nie o konkretne słowa, ale bardziej w stylu "o co w tym chodzi?". Wielu ludzi uważa, że rozwiązaniem tego typu problemów jest sieć semantyczna. My jednak patrzymy na sprawę inaczej - przy dużej ilości danych, zaczynasz dostrzegać rzeczy, które w działaniu sprawiają wrażenie inteligentnych, chociaż w istocie dotarcie do nich odbywało się na najniższym poziomie.

Na przykład kiedy wpiszesz do Google "GM", to wiemy, że chodzi o "General Motors". Z kolei jeśli wpiszesz "GM foods", odpowiadamy "genetically-modified foods" [ang. żywność modyfikowana genetycznie]. Ponieważ przetwarzamy ogromne pokłady informacji, mamy wiele danych o kontekście, np. wokół akronimów. I dochodzi do tego, że silnik wyszukiwarki wygląda na sprytny, tak jakby znał semantykę, tymczasem naprawdę tak nie jest. Opiera się to po prostu na rozwiązaniach typu "brute force". Moim zdaniem, najlepszym algorytmem dla wyszukiwania powinny być metody obliczeniowe typu brute-force, wynikające ze zwykłej złożoności analizy dużej ilości danych oraz metoda jakościowa opierająca się na ludziach.

{{dalej}}

Na jakim etapie znajdują się rozwiązania uniwersalnego wyszukiwania (ang. universal-search)?

Na wczesnym. I pracujemy nad radykalnymi zmianami. Zespół uruchomił uniwersalne wyszukiwanie w maju. Książki, grafiki, wiadomości, klipy wideo i informacje lokalne mogą być wymieszane z ogólnymi wynikami wyszukiwania. Zespół poświęca teraz swój czas i energię pracy w trzech obszarach.

Po pierwsze - pracują nad wersjami narodowymi, by z tego narzędzia można było korzystać w różnych krajach i językach, ponieważ na razie dostępne ono było po angielsku i to głównie dla Amerykanów. Po drugie chcą do universal-search wprowadzić wyniki z blogów, patentów i tekstów naukowych. Po trzecie, dążą do tego by nastąpiły bardziej radykalne zmiany, jak poprawienie ogólnej jakości wyników, lepsze powiązania znaczeniowe czy prezentacja wyników i cała kwestia interfejsu.

Właśnie te trzy elementy powodują, że wyszukiwanie uniwersalne to naprawdę duże wyzwanie dla Google. Musimy zmienić całą infrastrukturę, by całość była efektywna kosztowo. Do tego dochodzi kwestia rankingu: jeśli jest już tyle różnorodnych rezultatów, to jak je uporządkować? Ostatni ważny element to interfejs użytkownika.

Obecnie infrastruktura jest już taka jak być powinna i inżynierowie mogą wreszcie skupić się na właściwym zadaniu: rankingach, relewancji i interfejsie użytkownika. Dużo eksperymentujemy w tym trzecim obszarze, budujemy prototypy, zakładamy jak wyszukiwanie uniwersalne będzie się rozwijało w perspektywie roku, dwóch, a nawet trzech lat.

Czyli ostatecznie chcecie zintegrować wszystkie wasze wyszukiwarki wertykalne: newsów, obrazów, książek i tak dalej, w ramach jednego okienka wyszukiwania?

Chcemy by ludzie myśleli o okienku wyszukiwania, jako o takim, które da im zawsze najlepszą odpowiedź. Oczywiście są przypadki, w których wiesz, że potrzebujesz grafiki czy artykułu newsowego, więc oczywiście nadal pozostaną odnośniki do tych niezależnych wyszukiwarek. Jednak nie powinno się z nich korzystać, jeśli nie jest się ekspertem i nie ma się pojęcia co jest w tych wszystkich specjalistycznych wyszukiwarkach. Chcielibyśmy by wszystkie indeksy, które mamy trafiły do jednej podstawowej wyszukiwarki.

Co Google robi z treściami "głęboko zaszytymi", czyli takimi, z którymi nie radzą sobie silniki wyszukiwarek?

Kwestia tych treści najczęściej wiąże się z bazami danych, a przeszukiwanie WWW nie jest najlepszym sposobem na przeszukiwanie baz danych. Zaczęliśmy więc robić takie rzeczy jak Google Base. Większość baz danych pozwala eksportować dane do XML, można wtedy wskazać Google Base by zindeksował te dane.

Czy to podejście się sprawdza?

Tak. Setki milionów przedmiotów zostało dodanych do Google Base. Robimy postępy w indeksowaniu tych danych, ale nie jesteśmy zadowoleni z tego jak są one prezentowane w wynikach wyszukiwania. Mamy więc te dane, ale z punktu widzenia uniwersalnego wyszukiwania trudno zdecydować, w jakich sytuacjach umieszczać je przy głównych wynikach wyszukiwania, a w jakich nie.

Czy zdaniem inżynierów, opracowywanie technologii wyszukiwania, jest nadal "cool", czy to nadal stymuluje zawodowo?

Wyszukiwanie jest nadal w większości nierozwiązanym problemem... Mamy sześć lat doświadczenia, w czymś co będzie nas zajmowało przez następne 500 lat. Nadal jest to zajęcie bardzo konkurencyjne, a do Google codziennie dołączają nowi pracownicy, którzy są bardzo podekscytowani, że będą mogli pracować przy wyszukiwaniu.

Trzy czy cztery lata temu ludzie mówili "Google jest wspaniałe, to maszynka do zarabiania pieniędzy, jednak użytkownicy mogą wybrać inną wyszukiwarkę właściwie niczego nie ryzykując". Na razie tak się nie stało, jednak problem na pewno istnieje. Jak Google traktuje tę kwestię?

Są dwa nie do końca oczywiste wnioski związane z pytaniem o przywiązanie użytkowników do naszej wyszukiwarki. Pierwszy, że jest to prawda: jeśli ktoś zbuduje lepszą wyszukiwarkę, użytkownicy prawdopodobnie zaczną z niej korzystać. I dlatego nasi pracownicy, w szczególności inżynierowie, są naprawdę dobrze zmotywowani i cały czas pracują nad tym by nikt nie miał lepszego wyszukiwania. Musimy udowadniać naszym użytkownikom każdego dnia, że nikt nie ma lepszego rozwiązania niż nasze.

Inna, nie tak oczywista obserwacja jest taka, że wyszukiwanie jest dużo bardziej "lepkie" niż to się niektórym wydaje. Intuicyjnie, wiesz, że możesz pójść gdzie indziej. Ale ludzie mają źródło, któremu ufają i wiele czasu zajmuje im podjęcie decyzji, żeby zostawić to do czego się przyzwyczaili i skorzystać z czegoś zupełnie innego.

Jeśli odnajdziesz długo poszukiwanego przyjaciela lub ważne informacje dotyczące trudnej do zdiagnozowania choroby myślisz "ale mam szczęście". I ten moment, każdy z nich kiedy najważniejsza dla Ciebie strona WWW ukazuje się jako pierwszy wynik w Google, zostaje w twojej pamięci. Pojawią się dodatkowy element - zaufanie. Świadomość, że to narzędzie naprawdę dało mi to czego potrzebowałem... Także koszty związane ze zmianą wyszukiwarki są o wiele wyższe niż się powszechnie uważa.

Kiedy operatorzy komórkowi wchodzą w wyszukiwanie? Pewnie możecie ominąć operatorów, jeśli użytkownik korzysta z mobilnej wyszukiwarki, albo nawiązać współpracę z operatorami dzięki, której wasze usługi są lepiej zintegrowane z tym co oni oferują.

Oczywiście mobilne przeglądarki WWW się sprawdzają. Jednak większa integracja jest znacznie bardziej korzystna. Widać to na przykładzie Google Maps, które zostało zintegrowane z iPhone'm.

Aplikacje do pobrania, takie jak Google Maps for Mobile czy Gmail for Mobile, często pozwalają pokonać niektóre ograniczenia jakie są narzucane przez oprogramowanie preinstalowane w telefonie komórkowym. To dobra strategia, by przekonać użytkowników nadających się do tego telefonów, do używania naszych produktów. Można więc albo nawiązać współpracę z operatorem, albo po prostu później dostarczyć aplikację.

Wyobrażam sobie, że żeby zacząć działać na rynku komórkowym, musi zostać nawiązanych wiele umów i transakcji?

Tak, rynek mobilny jest bardzo skomplikowany. Do tej pory mamy na swoim koncie kilka bardzo udanych umów o współpracę w co najmniej kilku krajach. Tak więc pracowaliśmy z partnerami telekomunikacyjnymi, ale również cały czas oferujemy rozwiązania alternatywne, czyli możliwość pobierania niezależnych aplikacji przez naszych użytkowników.

Tłumaczenie wywiadu " Google wants your phonemes", Juan Carlos Perez, IDG News Service (Miami Bureau). Wstęp i tytuł od redakcji.

Piotr Zalewski