Nadchodzi nowy, lepszy Google

Google ma już wkrótce całkowicie zmienić sposób działania swojej wyszukiwarki. Przestanie polegać na rankingu stron, a zajmie się analizą znaczenia wpisywanych przez nas słów. W końcu!
"WSJ": Nadchodzi nowy, lepszy Google Google ma już wkrótce całkowicie zmienić sposób działania swojej wyszukiwarki Jak podaje "Wall Street Journal", słowa wprowadzone do wyszukiwarki Google będą wkrótce podlegać analizie semantycznej. Mechanizm powinien wziąć pod uwagę nie same słowa, lecz także czas ich wprowadzania, lokalizację, z jakiej są wpisywane, a także kontekst wypowiedzi (o ile wypowiedź jest rozbudowana). Brzmi świetnie, prawda? W praktyce może wyglądać to tak, że wystarczy wpisać w wyszukiwarkę frazę "Gdzie kupię nowego iPada", a Google będzie już wiedział, w jakim mieście powinien szukać i którego "nowego iPada" brać pod uwagę. "WSJ" podpowiada, że do analizy semantycznej wykorzystane może być młode przedsiębiorstwo Metaweb Technologies, które zostało przejęte przez Google w 2010 roku. Zajmuje się ono właśnie "tworzeniem bazy wiedzy opartej na analizie znaczeniowej". W zbiorach Metaweb Technologies ma znajdować się obecnie 12 milionów bytów, obejmujących książki, filmy czy przedsiębiorstwa. W najpopularniejszej do tej pory "bazie wiedzy", czyli Wikipedii, znajduje się takich bytów 3,5 miliona (przynajmniej, jeśli weźmiemy pod uwagę jedynie Wikipedię anglojezyczną). Gdy Google wprowadzi do swojej wyszukiwarki analizę semantyczną, zyskają na tym wszyscy. No, prawie wszyscy. Z pewnością zyskamy my, użytkownicy poszukujący w sieci informacji. Stracić mogą za to serwisy, których istnienie uzależnione jest od dobrego wypozycjonowania się w Google. Przykładem niech będą tzw. "farmy kontentu", albo popularne porównywarki cen. Pamiętacie może, co pod koniec stycznia stało się ze Skąpcem, Nokautem czy Ceneo? Google całkowicie wyciął je z wyników wyszukiwania. Wówczas była to kara za nieprzestrzeganie regulaminu; czy w przyszłości po zmianie sposobu działania wyszukiwarki Skąpiec, Ceneo czy Nokaut dalej będą pojawiać się wysoko na liście wyników wyszukiwania? Jest to dość wątpliwe.

Dwa problemy Google

Google się zepsuł. Taka jest smutna prawda. Do wyników wyszukiwania coraz częściej przedostają się śmieciowe strony, które trafiają na coraz wyższe pozycje. Smutna prawda jest też taka, że to my - przepraszam za wyrażenie, internauci - psujemy Google. W końcu śmieciowe strony same nie powstają, tworzą je osoby, które wykorzystują słabość Google - wykorzystywanie rankingu stron do wyświetlania wyników wyszukiwania. To pierwszy problem.

Drugi problem polega na tym, że w ciągu lat korzystania z internetu nauczyliśmy się już, jakie frazy należy wpisać w wyszukiwarkę, aby otrzymać najlepszą odpowiedź. Nie będą to już więc "buty", ale "buty, zamszowe, kozaki, sklep". To jeden sposób wyszukiwania. Same "buty" są bardziej intuicyjne, ale Google nie poradzi sobie z nim najlepiej.

Dobrym przykładem są też frazy typu "nowy Android" (przykład z życia, codziennie ktoś trafia na Technologie wpisując taką właśnie frazę). Osoba, która szuka informacji o nowym mobilnym systemie operacyjnym Google wie doskonale, czego szuka. Teraz to prawdopodobnie Android 4.0; za kilka miesięcy będzie to już jednak Android 5.0. Jeśli teraz wpiszecie w Google "nowy Android", to na pierwszym miejscu powinien pojawić się odnośnik do tego tekstu. Jest to artykuł podsumowujący najważniejsze nowości, które pojawiają się w Androidzie 4.0. Ale napisałam go w październiku. Większy problem będzie jednak z iPadem. Skoro Apple rezygnuje z numerowania kolejnych wersji tabletu, to jak mamy go określać, żeby po kolejnej premierzy trafić na właściwy tekst o "nowym iPadzie"? Czy kolejny tekst o "tym właściwym nowym iPadzie" wyprze ten stary?

Może nie będzie musiał

Rozwiązanie dwóch problemów Google

Rozwiązanie znane jest już od dawna, ale jest dość skomplikowane do opracowania i stworzenia. To analiza znaczenia wpisywanych przez nas w wyszukiwarkę słów (tzw. analiza semantyczna). Jak podaje Wall Street Journal, takie właśnie rozwiązanie może być wprowadzone do wyszukiwarki Google. Wówczas jeśli będziecie szukać "nowego Androida", to mechanizm powinien wziąć pod uwagę nie same słowa, lecz także czas ich wprowadzania, lokalizację, z jakiej są wpisywane, a także kontekst wypowiedzi (o ile wypowiedź jest rozbudowana). Brzmi świetnie, prawda?

W praktyce może wyglądać to tak, że wystarczy wpisać w wyszukiwarkę frazę "Gdzie kupię nowego iPada", a Google będzie już wiedział, w jakim mieście powinien szukać i którego "nowego iPada" brać pod uwagę.

Dlaczego tak późno?

Podobne rozwiązania są już na rynku. Jeszcze nie są idealne, jeszcze nie zawsze działają tak, jakbyśmy tego oczekiwali, ale są.

Wolfram Alpha

Jedno z nich znajduje się w Wolfram Alpha. Serwis ten można traktować w dwojaki sposób - jako wyszukiwarkę, której nie udało się przebić do powszechnej świadomości, lub jako bazę wiedzy. Podaje precyzyjne odpowiedzi na pytania dotyczące faktów - na przykład gdzie jest Kilimandżaro, ile kalorii ma pączek, jaki był dzień tygodnia w chwili moich narodzin, jaka jest teraz pogoda w Warszawie.

Spróbujcie znaleźć jednocześnie w Google i w Wolfram Alpha informację o tym, jaka była populacja Europy w roku 1874. Teraz Google wyszuka strony, na których bez ładu i składu znajdą się żądane frazy kluczowe. Wolfram Alpha po prostu poda odpowiedź.

Silnik Wolfram Alpha został wykorzystany już w innej wyszukiwarce - w Bingu Microsoftu. Między innymi w ten sposób Microsoft chciał odróżnić swój produkt od Google. Nawet hasło reklamowe Binga podkreślało, że pomaga on w podejmowaniu decyzji, a nie tylko odpowiadaniu na proste pytania.

Wolfram Alpha wykorzystywany jest przez jeszcze jedną usługę. Przez Siri, wbudowaną w iPhone'a 4S. Jak zauważył kiedyś New York Times, aż 25% wyszukań w WA pochodzi właśnie z Siri. Wirtualna asystentka jest w stanie odpowiedzieć nawet na skomplikowane pytania, ponieważ pod uwagę brany jest kontekst wypowiedzi (oraz czynniki takie jak pogoda, lokalizacja, data, itd).

Jeśli Google wprowadzi podobne rozwiązanie, to w końcu będzie miał pełnoprawną odpowiedź na odnoszącą sukcesy Siri.

Skąd Google będzie czerpać wiedzę?

WSJ podpowiada, że do analizy semantycznej wykorzystane może być młode przedsiębiorstwo Metaweb Technologies, które zostało przejęte przez Google w 2010 roku. Zajmuje się ono właśnie "tworzeniem bazy wiedzy opartej na analizie znaczeniowej". W zbiorach Metaweb Technologies ma znajdować się obecnie 12 milionów bytów, obejmujących książki, filmy czy przedsiębiorstwa.

W najpopularniejszej do tej pory "bazie wiedzy", czyli Wikipedii, znajduje się takich bytów 3,5 miliona (przynajmniej, jeśli weźmiemy pod uwagę jedynie Wikipedię anglojezyczną).

Symbioza z Google czasem nie popłaca

Jeśli (gdy) Google wprowadzi do swojej wyszukiwarki analizę semantyczną, zyskają na tym wszyscy. No, prawie wszyscy. Z pewnością zyskamy my, użytkownicy poszukujący w Sieci informacji. Stracić mogą za to serwisy, których istnienie uzależnione jest od dobrego wypozycjonowania się w Google. Przykładem niech będą tzw. "farmy kontentu", albo popularne porównywarki cen.

Pamiętacie może, co pod koniec stycznia stało się ze Skąpcem, Nokautem czy Ceneo? Google całkowicie wyciął je z wyników wyszukiwania. Wówczas była to kara za nieprzestrzeganie regulaminu; czy w przyszłości po zmianie sposobu działania wyszukiwarki Skąpiec, Ceneo czy Nokaut dalej będą pojawiać się wysoko na liście wyników wyszukiwania? Jest to dość wątpliwe, choć może z czasem uda się też oszukać tego nowego, mądrzejszego i inteligentniejszego Google'a?

Więcej o: