Big Data zastąpią badania opinii społecznej? W poszukiwaniu boskiego algorytmu

Robert Kędzierski
Prowadzone od lat badania nad big data mogą sprawić, że wkrótce niepotrzebne staną się tradycyjne badania opinii publicznej. Algorytmy będą znały odpowiedzi na wiele pytań analizując ślady, które pozostawiamy poruszając się w cyfrowej przestrzeni. Nim się jednak tak stanie naukowcy muszą nauczyć maszyny jak odróżnić przypadkowe korelacje pomiędzy danymi od tych istotnych. Jak stworzyć boski algorytm?

Linkfluence to startup stworzony przez specjalistów od social media i badania danych. Jego celem jest opracowanie technologii, która pozwoli przewidywać różnego rodzaju zachowania ludzi - głównie zachowania społeczne. Źródłem wiedzy jest big data. 

Przeczytaj też: Zadziwiające badania Microsoftu. Ludzi wyprzedziła... złota rybka

Czym jest big data? To analiza olbrzymich zbiorów bardzo zróżnicowanych danych i wyciąganie z nich wniosków. Dzięki zasobom danych analitycy są w stanie przewidzieć np., jak zachowa się wybrana osoba, albo określona przez wybrany parametr grupa osób. 

Dla Linkfluence oznacza to możliwość zbierania i analizowania tego, co użytkownicy dobrowolnie wyrażają komentując lub lajkując w internecie (dane deklaratywne). Oznacza to także możliwość obserwowania tego, co robią. Big data jest nowym szkiełkiem, przez które pozwala obserwować społeczeństwo. Jego największą zaletą jest to, że niczego nie zakłada.

Big data są wykorzystywane coraz śmielej.

Człowiek, który przewidział wynik wyborów

O tym, że big data może być przydatne do przewidywania zachowań społeczeństw przekonał nas Nate Silver, uczony, który przewidział wynik ostatnich wyborów prezydenckich w USA. Kluczem do jego sukcesu było właśnie wykorzystanie Big Data. 

Dlaczego zatem Linfluence nie chce powtórzyć metodologii Slivera i przewidywać przyszłość? Badacz opierał się w sporym stopniu na tradycyjnych ankietach. Prawdziwym celem naukowców jest stworzenie takiej metody, która pozwoli używać analizy big data korzystając z cyfrowych śladów, jakie zostawiamy za sobą w sieci - na Facebooku, w wyszukiwarce, na Twitterze, podczas robienia zakupów online. A śladów tych jest z każdym rokiem coraz więcej. 

Główny algorytm czyli absurdalne korelacje

Dane nie zanalizują się jednak same, trzeba stworzyć coś co nazwać można głównym albo boskim algorytmem. Przypomina to poszukiwanie świętego Graala. Polega na odnajdywaniu absurdalnych, ale trafnych korelacji pomiędzy na pozór nie związanymi ze sobą informacjami.

InwigilacjaInwigilacja Fot. PAWEL KOPCZYNSKI REUTERS

W 2014 roku Koleje Francuskie zamówiły analizę danych dotyczącą ilości pasażerów. Korzystając z ogólnie dostępnych danych ktoś znalazł korelację pomiędzy ilością pasażerów korzystających z dowolnej stacji z ilością salonów fryzjerskich działających w pobliży dworców. Chociaż jest to prawidłowa metoda matematyczna, to nie powinno się jej stosować do przewidywania liczby osób korzystających ze stacji. Absurdalne korelacje mogą pojawiać się przez przypadek, mogą jednak stać za nimi ukryte zmienne. Najprawdopodobniej jednak im bardziej popularna jest stacja, tym więcej sklepów i salonów znajduje się w jej pobliżu. Czy nadejdzie dzień, w którym maszyny będą w stanie zrozumieć znaczenie odnalezionej korelacji? Wygląda na to, że Boski Algorytm wciąż jest Świętym Graalem.  - twierdzi Leonardo Noleto  z firmy OVH, dostawcy usług hostingowych i chmury, rozwijającej autorskie rozwiązania z zakresu big data

Coraz więcej śladów

W Linkfluance wiedzą, że w tej chwili informacji, które pozostawia przeciętny użytkownik wciąż jest za mało. Jednocześnie rozumieją, że ilość śladów, jakie pozostawiamy za sobą przemierzając cyfrową przestrzeń rośnie. I to w gigantycznym tempie. Coraz bardziej przenika się bowiem nasza cyfrowa i realna aktywność. Smartfony są z nami wszędzie i chociażby z danych lokalizacyjnych można wyciągnąć mnóstwo wniosków. 

Osobną kwestią pozostaje kwestia zaufania do badań opinii społecznych przeprowadzanych przez algorytmy. Analiza Big data może być przecież obarczona ryzykiem manipulacji. Żyjemy w świecie, w którym rządzą liczby. Pamiętajmy jednak o tym, że sztuka manipulowania danymi jest stosowana od dawna zarówno w biznesie jak i polityce. Ludzie kochają wykresy, lubią być utwierdzani w swoich opiniach. Czy big data faktycznie okaże się sposobem na badania, które "niczego z góry nie zakładają"? 

Na podstawie ovh.co.uk

Więcej o: