Tych surrealistycznych obrazów nikt nie tworzył. To komputery starają się zrozumieć świat

Joanna Sosnowska
19.06.2015 16:59
A A A
Sztuczna inteligencja Google świetnie

Sztuczna inteligencja Google świetnie "maluje" (Fot. Google)

Co można zobaczyć na zwykłym zdjęciu przedstawiającym niebo i chmury? Przy odrobinie wyobraźni kształt obłoków skojarzy nam się z zarysem budynku albo zwierzęcia. Ale gdy pokazać takie zdjęcie komputerowi... dostrzeże na nich zwierzęta i obiekty jak ze snów.

Zapewne wszyscy znacie opcję wyszukiwania podobnych obrazów w Google. Wystarczy wpisać dowolną frazę (np. zebry) i wybrać w wyszukiwarce funkcję Grafika. Otrzymamy zestawienia zdjęć zebr. No, w większości to będą zebry, bo trafi się także ryba i pies z umaszczeniem jak u zebry. Skąd Google wie, czym jest i jak wygląda zebra? Dzięki komputerowej sieci neuronowej, która uczy się rozpoznawać obrazy.

Kilka dni temu pisaliśmy o dziwnym (i dość niepokojącym) obrazie, który został stworzony przez sztuczną inteligencję. Teraz wiadomo już, że jest to jeden z etapów nauki komputera, jak rozpoznawać obiekty na zdjęciach. Google uchylił bowiem rąbka tajemnicy na swoim blogu. Jak powstają te niesamowite obrazy?

Żeby nauczyć komputer jakiegoś pojęcia (np. "widelec"), komputerowi dostarcza się przeróżne zdjęcia widelca, a ten uczy się rozpoznawania tego konkretnego obiektu w różnych konfiguracjach (widelec w ręku, widelec na stole, widelec z dwoma ząbkami, widelec z trzema ząbkami, widelec z ułamanym zębem, drewniany, plastikowy, itd). Sieć neuronowa nie dostaje informacji, do czego służy widelec, ani jakie cechy musi mieć, żeby wciąż być widelcem, a nie trójzębem - ma je sama wydedukować na podstawie zdjęć.

Taka sieć działa na kilkudziesięciu poziomach; warstw sztucznych neuronów jest przeważnie 10-30. Każda warstwa odpowiada za coraz bardziej skomplikowane działania. Jedna rozpoznaje krawędzie obiektów, inna kolory, jeszcze inna obiekty. Jak czytamy na blogu Google:

"Każdy obraz trafia do pierwszej warstwy, która komunikuje się następnie z warstwą kolejną, tak długo, aż w końcu osiąga warstwę "wyjściową". Odpowiedź sieci otrzymujemy właśnie od tej ostatecznej warstwy".

Skąd jednak możemy mieć pewność, że komputer naprawdę potrafi rozpoznawać widelec (albo jakikolwiek inny obiekt)? Jak czytamy na blogu, rozwiązaniem jest poprosić sieć o reprezentację tego, jak według niej poszukiwany obiekt wygląda. Ta metoda czasem się sprawdza, ale niekiedy okazuje się, że komputer nie zrozumiał istoty danej rzeczy. Na zdjęciu poniżej widzicie, jak sieć neuronowa wyobraża sobie hantle. Widać, że według niej do hantla w każdym wypadku musi być doczepiona muskularna ręka.

Hantle według sieci neuronowej GoogleFot. Google

Dzięki takim sprawdzianom można wyłapać błędy popełniane przez sieć i udostępnić jej więcej zdjęć hantli - np. takich, które nie są trzymane przez człowieka.

Jeszcze ciekawiej robi się, gdy wskazać sieci dany obraz i poprosić ją o wskazanie i uwypuklenie tego, co tam widzi. Google tłumaczy:

"Oczekujemy, że sieć uwydatni nam to, co widzi. To jednak tworzy pętlę informacji zwrotnych - jeśli chmura wygląda odrobinę jak ptak, to sieć poprawi ją, by przypominała go trochę bardziej. Następnie, przy kolejnej analizie, ptak będzie przez to bardziej wyraźny, więc sieć jeszcze bardziej go podciągnie. I tak w kółko, aż cały ptak pojawi się w obrazie, właściwie znikąd".

(kliknij obrazek aby powiększyć)

Widzieliście te obiekty wcześniej na zdjęciu?Fot. Google

Wyraźnie widać, że nastąpiło sprzężenie zwrotne i z każdą kolejną warstwą komputer dorabiał kolejne nadinternpretacje obrazu. Znikąd pojawiają się kształty przypominające ślimaki, kopuły kościołów, ptaki czy miasta, świnio-ślimaki, pso-ryby. Jeśli poprosimy sieć o znalezienie na zdjęciu zwierząt, otrzymamy rezultat taki, jak zdjęcie na górze ilustrujące artykuł.

Inny przykład: co dostrzeżecie na tym zdjęciu?

(kliknij obrazek aby powiększyć)

Ten pejzaż nie wie, co go czekaFot. Google

Sieć neuronowa Google zobaczy na nim dużo więcej:

(kliknij obrazek aby powiększyć)

Ostateczny rezultat jest... niepokojącyFot. Google

(kliknij obrazek aby powiększyć)

Nie widzieliście tego na zdjęciu, prawda?Fot. Google

Google tłumaczy, że sieć neuronowa "karmiona jest" głównie obrazami zwierząt, dlatego to właśnie je w różnych - czasem wybitnie surrealistycznych - odmianach dostrzega. A teraz pomyślcie nad tym, jak wy sami postrzegacie wygenerowane przez komputer interpretacje zdjęcia i jak wasz mózg doszukuje się na nich znajomych albo pseudo-znajomych kształtów. Sieć neuronowa jest trochę jak dziecko, które od podstaw uczy się rozpoznawania świata. Jej wizje są oniryczne i dla ludzkiego mózgu dość niepokojące. W końcu jednak wiemy, o czym śnią androidy.

Więcej zdjęć znajdziecie w galerii.

Komentarze (39)
Zaloguj się
  • grenlandzki-opos

    Oceniono 125 razy 111

    Dziękuję, wartościowy materiał. Perełka którą czasami rzucą w ten chłam.
    Dla chcących dowiedzieć się więcej wpiszcie google image recognition bo jakiś faszysta zablokował linki

  • vontomke

    Oceniono 62 razy 56

    Wygląda na to że sztuczne sieci neuronowe tak jak niesztuczne mogą tripować.

  • itsgettingcolder

    Oceniono 26 razy 12

    Może dostrzegają coś, czego my nie widzimy. Np ciemną materię :))

  • Oceniono 99 razy 59

    Taka mniej więcej komputerowa logika doprowadziła Macierewicza od samolotu do parówki....

  • gucio1882

    Oceniono 59 razy 55

    Nic dziwnego, ze Terminator zabijał wszystko, co zobaczył. Jak ja bym miał taki widok po otwarciu oczu, też bym do wszystkiego naparzał.

  • mesaverde111

    Oceniono 38 razy 32

    Salvador Dali by z logarytmem pogadał...

    Np. o wykluczeniu go w '39 z grona surrealistów:)

    Ach te niezapomniane wieczory przy amfie, wódzie i fajach...

    Obudzić się w kalesonach, zarzyganym pod samą brodę: bezcenne:)

    Lub: bezeccne.

    :P

  • Oceniono 30 razy 24

    No i się cała zagadka psychedelii wyjaśniła.
    Ludkom po LSD czy acodinie wydawało się,
    że złapali Pana Boga za nogi, a to tylko nawalony
    łeb dostrzegał cuda na kiju (w tym mnóstwo oczu,
    fraktale zapełniające gładkie wcześniej płaszczyzny,
    twarze), tam gdzie ich wcale nie było.

Aby ocenić zaloguj się lub zarejestrujX