Język polski jest najlepszy do trenowania sztucznej inteligencji - do takich wniosków doszli naukowcy z University of Maryland i Microsoftu. Sami byli zaskoczeni tym wynikiem, bo to w końcu język z nieporównywalnie mniejszymi zasobami treningowymi w porównaniu do np. j. angielskiego i chińskiego. Właśnie na nich najczęściej trenuje się sztuczną inteligencję, ale mimo to oba ta języki były daleko za polskim w badaniu.
Naukowcy sprawdzali zdolność modeli językowych do pracy z tzw. długim kontekstem. W największym uproszczeniu AI musiało znaleźć w bardzo rozbudowanych tekstach konkretne informacje, lub przeprowadzić ich syntezę. Sprawdzano też, czy sztuczna inteligencja nie oszukuje i nie wymyśla odpowiedzi na pytania, których nie można było znaleźć w przesłanym tekście. W tym teście język polski miał aż 88 proc. skuteczności. Angielski zajął dopiero 6. miejsce spośród 26 badanych języków, ze średnią dokładnością na poziomie 83,9 proc. Jeszcze bardziej zaskakujący był wynik j. chińskiego, który był czwartym najgorszym językiem ze średnią dokładnością wynoszącą 62,1 proc.
Co ciekawe, pierwsze dziesięć miejsc zajmują języki słowiańskie, romańskie i germańskie, które mają dużą liczbę artykułów w Wikipedii i używają alfabetu łacińskiego. Lepiej wypadły też tzw. języki wysokozasobne, czyli te, w których jest po prostu więcej treści. W zależności od języka konteksty i dokładność sztucznej inteligencji może się różnić nawet o ok. 20 proc. Według naukowców to sygnał, że warto przy trenowaniu sztucznej inteligencji postawić na języki niszowe jak np. polski, które mogą okazać się skuteczniejsze przy trenowaniu modeli językowych.
W badaniu nie postawiono jednoznacznej tezy, dlaczego język polski wypadł tak dobrze, a język chiński i angielski tak słabo. Jedną z możliwych hipotez jest to, że polszczyzna ze względu na swoją strukturę i cechy gramatyczne może być dokładniejsza. Ogranicza to możliwość wystąpienia dwuznaczności, która w długich i skomplikowanych tekstach, może być myląca dla sztucznej inteligencji.
Przeczytaj też: "Zaskakujący ruch właściciela Facebooka. Poszedł e-mail. 'Twój dostęp zostanie zablokowany'".
Źródła: cryps.pl, national-geographic.pl, arxiv.org