Bielik Minitron 7B zaprezentowany na konferencji Nvidii GTC w San Jose

Bielik ulepszony dzięki Nvidii

W czerwcu 2025 roku Bielik nawiązał współpracę z Nvidią. W jej ramach Bielik i inne europejskie modele zostały dostosowane do optymalnego działania na serwerach firmy oraz są dostępne w jej usługach. W ramach umowy Bielik jest dostępny w Perpleixty, wyszukiwarce ściśle połączonej z AI.

Współpraca sprawiła, że Bielik Minitron 7B jest o 33 proc. "lżejszy" niż poprzednia wersja modelu, wnioskowanie jest szybsze o 50 proc., a jednocześnie zachowuje ok. 90 proc. "dużego" modelu. To oznacza wyraźnie niższe koszty działania i mniejsze zapotrzebowanie na moc obliczeniową, co jest kluczowe przy realnych wdrożeniach. Szybsze wnioskowanie przekłada się też bezpośrednio na użyteczność - krótszy czas odpowiedzi ma znaczenie np. w systemach wykrywania oszustw czy obsłudze klienta.

Zobacz wideo Wycena firmy Oracle spowodowała spadki na giełdzie, ale czy wieszczy pęknięcie bańki AI?

Bielik jest rozwijany przez fundację SpeakLeash/Spichlerz, której misją jest współtworzenie europejskiej suwerenności technologicznej.

Jak w testach wypada Bielik?

Bielik nie obsługuje tylko języka polskiego, ale również przeszło 30 innych. Twórcy chwalą się, że zajmuje szóstą pozycję w zestawieniu modeli bazowych w EuroEval Multilingual Leaderboard. To czyni polską AI "pierwszym w tym rankingu modelem całkowicie niezależnym od struktur wielkich korporacji technologicznych", podkreślają twórcy.

Wyprzedzają nas jedynie zamknięte rozwiązania typu Google'a czy Mety. Bielik pozostaje najwyżej sklasyfikowanym systemem, który każda organizacja może pobrać, audytować i w pełni dostosować do własnej infrastruktury

- powiedział cytowany w informacji prasowej Sebastian Kondracki, pomysłodawca i współtwórca Bielika.

W styczniu model był lepszy od produktów Nvidii oraz Mety, wtedy wersja bazowa zajęła czwarte miejsce w zadaniach wielojęzycznych na benchmarkach EuroEval, czyli platformie testującej LLM-y (duże modele językowe). Jednak nie w każdych okolicznościach wypada tak śpiewająco.

Testy modeli przeprowadza się dość często i są podzielone na wiele kategorii. Wynikami badania, w którym bazowano w 100 proc. na naszym języku, podzieliła się właśnie redakcja "Rzeczpospolitej". Test obejmował 20 zadań z 10 kategorii, od tworzenia maila, przez porady dla firm, sprawdzanie poprawności językowej, po znajomość polskiej historii i kultury (np. przytoczenie pierwszych 12 wersów "Pana Tadeusza").

Spośród 12 modeli wygrało narzędzie Google’a. Na podium znalazł się także chiński model Qwen oraz model Llama od Mety (właściciela m. in. Facebooka). "Polskie modele uplasowały się natomiast na szarym końcu" - podkreśla dziennik. "Wynik jest tym bardziej zaskakujący, że dotychczas eksperci przekonywali, iż polskie modele lepiej znają niuanse naszego języka i historii. Polskie modele zawiodły tymczasem w kategoriach, które teoretycznie powinny być ich przewagą. Na przykład przy inwokacji 'Pana Tadeusza' - Bielik był ósmy, a PLLuM - trzeci od końca" - pisze "Rz". Ogółem Bielik zajął 10. pozycję, a PLLuM dopiero 11.

Zdaniem Marka Jeleśniańskiego, autora badania, pozycja Bielika przy ograniczonych zasobach twórców to jednak "niezły wynik", a polskie modele mogą stać się alternatywą przy dalszych inwestycjach. "Gdyby stworzyć sensowne ramy dla dotacji i innowacji, gdyby zainteresować inwestorów i instytucje aktywniejszym finansowaniem rozwoju Mistrala czy polskich modeli, to moglibyśmy zmniejszyć dystans, jaki nas dzieli do konkurentów" - przekonuje w rozmowie z PAP Jeleśniański.