Bielik powstał jako inicjatywa Fundacji SpeakLeash rozwijającej otwarte modele językowe w polskim wydaniu. Obecna wersja, Bielik v3 została zaprezentowana na benchmarkach EuroEval, czyli platformie testującej LLM-y (duże modele językowe). W badaniach porównawczych, w których udział wzięły również największe globalne marki, polski produkt wypadł zaskakująco dobrze.
Model w wersji bazowej zajął czwarte miejsce w zadaniach wielojęzycznych. Jako model instrukcyjny zdobył w tej samej kategorii 32 miejsce. W czołówce znajdują się głównie modele tworzone przez największe firmy branżowe. Mimo to udało się wyprzedzić Nemotron 30B (Nvidia) , OLMo 32B i Llama 3.1 8B (Meta). Informacje o tym podał na X Sebastian Kondracki, jeden z założycieli SpeakLeash. "Jeśli uwzględnimy wyłącznie modele instrukcyjne, bez modeli wnioskujących, Bielik v3 plasuje się na 18. miejscu" - wspomniał.
"W ciągu ostatnich kilkunastu miesięcy Bielik przeszedł drogę od oddolnego projektu technologicznego do jednego z ważniejszych inicjatyw AI w Europie Środkowo-Wschodniej" - można przeczytać na blogu Azurro dostawcy usług specjalizującego się w sztucznej inteligencji, którego współzałożyciel, Krzysztof Ociepa zajmuje się w zespole Bielika trenowaniem modeli. Jak piszą autorzy wpisu, o sukcesie projektu zadecydowało otwarte podejście i silne zaplecze technologiczne oraz strategiczne wsparcie. Projekt od początku był wspierany m.in. przez Akademickie Centrum Komputerowe Cyfronet AGH, które gwarantowało dostęp do infrastruktury obliczeniowej.
Projekt miał na celu zebranie polskojęzycznych danych i stworzenie modelu językowego odpowiadającego lokalnym użytkownikom pod względem językowym czy kulturowym. Obecnie ma już ponad 100 tys. użytkowników, milion pobrań i aktywną społeczność liczącą 4000 osób. Całość posiada też wiele przydatnych narzędzi. To m.in. "Sójka" związana z bezpieczeństwem i wykrywaniem szkodliwych treści w komunikacji cyfrowej, "Eskadra Bielika" obejmująca warsztaty edukacyjne, a także "Obywatel Bielik", w którym społeczność tworzy zestaw danych związanych z polską historią i kulturą.
Fundacja do spółki z Rafałem Brzoską zainicjowała też akcję "Nakarm Bielika". Model został powiązany z aplikacją InPostu, a jej użytkownicy, korzystając w ten sposób z rodzimego LLM-a, pomagają w jego treningu i rozwoju. Model został również włączony do inicjatyw Nvidii dotyczących budowy ekosystemów modeli językowych i wskazany jako reprezentant na Europę Środkowo-Wschodnią.
Czytaj też: Rafał Brzoska chce, żebyśmy "karmili" Bielika. I zapowiada tajemniczą "rewolucję"