Krypto-porażka ChatGPT. Sztuczna inteligencja traci na handlu kryptowalutami

Konkurs na najlepszego inwestora wśród modeli sztucznej inteligencji zakończył się sromotną porażką większości z nich. Tylko dwa z testowanych AI zdołały zarobić na inwestycjach, a najgorzej wypadł chatGPT.
logo chatGPT
Fot. REUTERS/Dado Ruvic

Pierwszy sezon turnieju dla "inwestorów AI"

Sposób na sprawdzenie, czy sztuczna inteligencja jest dobra w zarabianiu pieniędzy? Nof1, które opisuje się jako pierwsze laboratorium badawcze testujące AI na rynkach finansowych, zdecydowało się na nietypowy eksperyment. Turniej Alpha Arena miał sprawdzić, jak duże modele językowe (LLM) radzą sobie w handlu na rynku kryptowalut

Sztuczna inteligencja bez podpowiedzi

"W Nof1 jesteśmy zainteresowani zrozumieniem, jak sztuczna inteligencja zachowuje się w świecie rzeczywistym i koncentrujemy się na domenie rynków finansowych, aby to osiągnąć" - napisali organizatorzy na swojej stronie. Badacze byli szczególnie zainteresowani tym, jak duży model językowy radzi sobie w handlu, mając do dyspozycji tylko minimalne podpowiedzi i nie dysponując wcześniejszymi przykładami (technika "zero-shot"). 

Do zawodów przystąpiło sześć modeli, wśród których znalazły się najbardziej popularne chatboty, m.in. chatGPT, Gemini i DeepSeek. Turniej rozpoczął się 18 października, a każdy model był równouprawniony pod względem dostępu do informacji, danych wejściowych czy początkowej kwoty wynoszącej 10 tys. dolarów. Handel odbywał się na zdecentralizowanej giełdzie Hyperliquid (24/7) bez ingerencji człowieka. Ograniczono też dostępne akcje do otwierania pozycji long i short, ich utrzymywania i zamykania, a transakcje dotyczyły sześciu kryptowalut popularnych na Hyperliquid (BTC, ETH, SOL, BNB, DOGE i XRP).

Zobacz wideo Donald i Melania Trumpowie wypuścili swoje kryptowaluty. To idealne narzędzie do lobbingu

Kiepskie wyniki modeli językowych

3 listopada konkurs się zakończył, a większość modeli skończyła na dużym minusie. GPT-5 (OpenAI) oraz Gemini 2.5 Pro (Google) już po kilku dniach zaczęły ponosić straty, a piątego dnia osiągnęły spadek, który utrzymał się praktycznie do końca. GPT-5 zajął ostatnie miejsce, notując stratę na poziomie 62,7 proc. i z początkowej puli zachowując jedynie 3733 dolary. Odrobinę lepiej poradził sobie model od Google - Gemini (spadek o 56,7 proc., 4329 dol.), a trzecie miejsce od końca zajął Grok 4 od xAI ze stratą 45,3 proc. i zachowaną kwotą 5469 dolarów.

Tylko chińskie modele zarobiły

Z modeli firm zachodnich najlepiej poradził sobie Claude Sonnet 4.5 od Anthropic, który stracił 30,8 proc. kapitału i uratował 6918 dolarów. Jedyne LLM, które okazały się zyskowne, to modele chińskie. DeepSeek 3.1 był na czele jeszcze 27 października z zarobkiem na czysto ponad 13 tys. dolarów. Ostatecznie jednak skończył na drugim miejscu z kwotą 10 489 dol (4,9 proc. na plusie). Najlepszy wynik osiągnął Qwen3-Max koncernu Alibaba z ostatecznym wynikiem 12 231 dol. (22,3 proc. zysku).

Organizatorzy zauważyli jednak, że pierwszy sezon z wąskim oknem czasowym ma ograniczoną moc statystyczną, a następne rankingi mogą wskazać innych zwycięzców. "Zaobserwowaliśmy stałe odchylenia w zachowaniu modeli, które utrzymywały się w czasie i pomimo wielu iteracji monitu (instrukcji). Ukształtowało się coś na kształt inwestycyjnej 'osobowości'" - wyjaśnili organizatorzy. W aktualnym sezonie modele celowo zostały postawione w "trudnej sytuacji". Planowana jest już kolejna odsłona AlphaArena 1.5, w której m.in. wprowadzone ma zostać więcej funkcji. 

Czytaj też: "Akcje giganta wystrzeliły na giełdzie. Podpisał megaumowę z potentatem od AI".

Źródła:Bankier, Nof1

Więcej o: