Google wykorzystuje tutaj swój system rozpoznawania mowy , zaprezentowany przez koncern jeszcze w listopadzie ubiegłego roku. Firma z Mountain View twierdzi, że wprowadzenie napisów do YouTube jest prawdopodobnie największym tego typu eksperymentem jak do tej pory.
Jak podaje BBC , Google chce w ten sposób umożliwić pełniejsze korzystanie ze swojego serwisu także osobom z problemami słuchu , a przez to "zdemokratyzować dostęp do informacji".
Musieliśmy zmierzyć się z wieloma problemami związanymi z wymową, jak choćby różnice w akcencie, szumy w tle, czy mnogość języków
mówił w rozmowie z BBC Mike Cohen, inżynier z Google.
YouTube Fot. YouTube
Warto tutaj wspomnieć, że system rozpoznawania mowy może także zostać zastosowany w aplikacji do telefonów komórkowych, za pośrednictwem której Google chce tłumaczyć rozmowy w czasie rzeczywistym .
Google podkreśla, że wprowadzane przez nich już teraz rozwiązanie dalekie jest od ideału.
Automatyczne rozpoznawanie mowy nie działa jeszcze tak dobrze jak byśmy chcieli, więc właściciel filmu powinien upewnić się, czy treść została dobrze oddana. Może też zdarzyć się tak, że nagranie audio jest złej jakości i napisów po prostu nie da się wygenerować
mówił Vic Gundotra, wiceprezes Google.
Automatyczne dodawanie napisów na YouTube działa na razie jedynie w języku angielskim i jeszcze nie we wszystkich filmach. Poniższe wideo wyjaśnia, jak działać ma rozwiązanie.
Przypomnijmy, że automatyczna transkrypcja może czasami płatać figle - jakiś czas temu serwis Gizmodo przytaczał historię jednego ze swoich czytelników. Zostawił on wiadomość głosową, którą Google Voice wysłało na telefon jego żony w formie transkrypcji. Nieco jednak przeinaczonej. Pierwotna wiadomość miała postać dość banalną:
Hej kochanie, właśnie wyszedłem z pracy. Jest 7.15, do zobaczenia w domu, pa.
Tymczasem złośliwy system przesłał małżonce wiadomość w postaci mniej więcej takiej:
Człowieku, jaki ze mnie drań i alkoholik 60, ech, to tylko kilka rzeczy, pa.
Powyższy przykład obrazuje jedynie, że w niektórych przypadkach (prawdopodobnie zakłóceń zewnętrznych ) automatyczna transkrypcja wymaga jeszcze wiele pracy.
Joanna Sosnowska