Tych surrealistycznych obrazów nikt nie tworzył. To komputery starają się zrozumieć świat

Co można zobaczyć na zwykłym zdjęciu przedstawiającym niebo i chmury? Przy odrobinie wyobraźni kształt obłoków skojarzy nam się z zarysem budynku albo zwierzęcia. Ale gdy pokazać takie zdjęcie komputerowi... dostrzeże na nich zwierzęta i obiekty jak ze snów.

Zapewne wszyscy znacie opcję wyszukiwania podobnych obrazów w Google. Wystarczy wpisać dowolną frazę (np. zebry) i wybrać w wyszukiwarce funkcję Grafika. Otrzymamy zestawienia zdjęć zebr. No, w większości to będą zebry, bo trafi się także ryba i pies z umaszczeniem jak u zebry. Skąd Google wie, czym jest i jak wygląda zebra? Dzięki komputerowej sieci neuronowej, która uczy się rozpoznawać obrazy.

Kilka dni temu pisaliśmy o dziwnym (i dość niepokojącym) obrazie, który został stworzony przez sztuczną inteligencję. Teraz wiadomo już, że jest to jeden z etapów nauki komputera, jak rozpoznawać obiekty na zdjęciach. Google uchylił bowiem rąbka tajemnicy na swoim blogu. Jak powstają te niesamowite obrazy?

Żeby nauczyć komputer jakiegoś pojęcia (np. "widelec"), komputerowi dostarcza się przeróżne zdjęcia widelca, a ten uczy się rozpoznawania tego konkretnego obiektu w różnych konfiguracjach (widelec w ręku, widelec na stole, widelec z dwoma ząbkami, widelec z trzema ząbkami, widelec z ułamanym zębem, drewniany, plastikowy, itd). Sieć neuronowa nie dostaje informacji, do czego służy widelec, ani jakie cechy musi mieć, żeby wciąż być widelcem, a nie trójzębem - ma je sama wydedukować na podstawie zdjęć.

Taka sieć działa na kilkudziesięciu poziomach; warstw sztucznych neuronów jest przeważnie 10-30. Każda warstwa odpowiada za coraz bardziej skomplikowane działania. Jedna rozpoznaje krawędzie obiektów, inna kolory, jeszcze inna obiekty. Jak czytamy na blogu Google:

"Każdy obraz trafia do pierwszej warstwy, która komunikuje się następnie z warstwą kolejną, tak długo, aż w końcu osiąga warstwę "wyjściową". Odpowiedź sieci otrzymujemy właśnie od tej ostatecznej warstwy".

Skąd jednak możemy mieć pewność, że komputer naprawdę potrafi rozpoznawać widelec (albo jakikolwiek inny obiekt)? Jak czytamy na blogu, rozwiązaniem jest poprosić sieć o reprezentację tego, jak według niej poszukiwany obiekt wygląda. Ta metoda czasem się sprawdza, ale niekiedy okazuje się, że komputer nie zrozumiał istoty danej rzeczy. Na zdjęciu poniżej widzicie, jak sieć neuronowa wyobraża sobie hantle. Widać, że według niej do hantla w każdym wypadku musi być doczepiona muskularna ręka.

Hantle według sieci neuronowej GoogleFot. Google

Dzięki takim sprawdzianom można wyłapać błędy popełniane przez sieć i udostępnić jej więcej zdjęć hantli - np. takich, które nie są trzymane przez człowieka.

Jeszcze ciekawiej robi się, gdy wskazać sieci dany obraz i poprosić ją o wskazanie i uwypuklenie tego, co tam widzi. Google tłumaczy:

"Oczekujemy, że sieć uwydatni nam to, co widzi. To jednak tworzy pętlę informacji zwrotnych - jeśli chmura wygląda odrobinę jak ptak, to sieć poprawi ją, by przypominała go trochę bardziej. Następnie, przy kolejnej analizie, ptak będzie przez to bardziej wyraźny, więc sieć jeszcze bardziej go podciągnie. I tak w kółko, aż cały ptak pojawi się w obrazie, właściwie znikąd".

(kliknij obrazek aby powiększyć)

Widzieliście te obiekty wcześniej na zdjęciu?Fot. Google

Wyraźnie widać, że nastąpiło sprzężenie zwrotne i z każdą kolejną warstwą komputer dorabiał kolejne nadinternpretacje obrazu. Znikąd pojawiają się kształty przypominające ślimaki, kopuły kościołów, ptaki czy miasta, świnio-ślimaki, pso-ryby. Jeśli poprosimy sieć o znalezienie na zdjęciu zwierząt, otrzymamy rezultat taki, jak zdjęcie na górze ilustrujące artykuł.

Inny przykład: co dostrzeżecie na tym zdjęciu?

(kliknij obrazek aby powiększyć)

Ten pejzaż nie wie, co go czekaFot. Google

Sieć neuronowa Google zobaczy na nim dużo więcej:

(kliknij obrazek aby powiększyć)

Ostateczny rezultat jest... niepokojącyFot. Google

(kliknij obrazek aby powiększyć)

Nie widzieliście tego na zdjęciu, prawda?Fot. Google

Google tłumaczy, że sieć neuronowa "karmiona jest" głównie obrazami zwierząt, dlatego to właśnie je w różnych - czasem wybitnie surrealistycznych - odmianach dostrzega. A teraz pomyślcie nad tym, jak wy sami postrzegacie wygenerowane przez komputer interpretacje zdjęcia i jak wasz mózg doszukuje się na nich znajomych albo pseudo-znajomych kształtów. Sieć neuronowa jest trochę jak dziecko, które od podstaw uczy się rozpoznawania świata. Jej wizje są oniryczne i dla ludzkiego mózgu dość niepokojące. W końcu jednak wiemy, o czym śnią androidy.

Więcej zdjęć znajdziecie w galerii.

Więcej o: