AI, które potrafi zhakować wszystko. Świat drży przed Mythosem. Ale czy słusznie?

Potrafi złamać najtrudniejsze zabezpieczenia i samodzielnie szukać luk w kodzie. Mythos - nowy model AI od Anthropic - jeszcze przed oficjalną premierą zyskał miano potężnego zagrożenia dla globalnego cyberbezpieczeństwa. Czy wokół "cyfrowego włamywacza" nie narosło jednak zbyt wiele - nomen omen - mitów?
Anthropic
Fot. REUTERS/Dado Ruvic

Nowy model jest zdolny do samodzielnej inwigilacji i przeprowadzania cyberataków właściwie na wszystkie systemy komputerowe. Potrafi również wykrywać nieznane wcześniej podatności (typu 0-day), czyli takie luki, które podczas tworzenia oprogramowania przeoczył sam producent. Choć narzędzie to może być pomocne w uszczelnianiu systemów, w nieodpowiednich rękach stanie się zagrożeniem. Nic więc dziwnego, że w internecie Mythos – zgodnie ze swoją nazwą – doczekał się już mrocznej legendy, która zdaje się żyć własnym życiem. Ile jest w tym prawdy?

"Cyfrowy włamywacz" bardzo niebezpieczny?

Nicholas Carlini, badacz cyberbezpieczeństwa współpracujący z firmą Anthropic, jako jeden z pierwszych dostrzegł destrukcyjny potencjał nowego modelu. Wykazał on, że stworzony przez inżynierów Mythos doskonale radzi sobie z przełamywaniem zabezpieczeń Linuksa – systemu operacyjnego open source, stanowiącego fundament infrastruktury wielu banków, organizacji rządowych i sił zbrojnych.

Model bez problemu omijał protokoły ochronne, zyskując dostęp do poufnych danych. Według eksperta algorytm przypominał wykwalifikowanego włamywacza, co w przypadku przejęcia nad nim kontroli przez niepowołane podmioty mogłoby doprowadzić do ogromnych strat. O swoich obawach Carlini natychmiast powiadomił zarząd. Jak donosił Bloomberg, badacz był wręcz zszokowany skutecznością systemu.

Zobacz wideo Wielkie centrum obliczeniowe zasilane elektrownią gazową

Za dalsze testy odpowiadała wewnętrzna grupa ekspertów – Frontier Red Team Anthropic. Miały one na celu ostateczną weryfikację skali potencjalnego zagrożenia. "W ciągu kilku godzin od otrzymania modelu wiedzieliśmy, że jest inny" – powiedział Logan Graham, który kieruje zespołem.

Zdolność do identyfikacji luk w kodzie wykazywał już wprawdzie wcześniejszy model Opus 4.6, jednak możliwości Mythosa weszły na zupełnie inny poziom. Graham ocenił system jako bezpośrednie zagrożenie dla bezpieczeństwa narodowego i zarekomendował szefostwu zablokowanie jego publicznej premiery.

Obawy i decyzja o wstrzymaniu premiery

Carlini zidentyfikował krytyczne luki w lutym, ale już miesiąc wcześniej współzałożyciel Anthropic, Jared Kaplan, dostrzegł coś niepokojącego, uważnie śledząc proces szkolenia sztucznej inteligencji. Zauważył, że model wybitnie dobrze radzi sobie z wyszukiwaniem słabych punktów w zabezpieczeniach, co uznał za zjawisko "bardzo istotne dla infrastruktury internetu".

Na przełomie lutego i marca Kaplan wraz z drugim współzałożycielem, Samem McCandlishem, podjęli debatę nad rynkowym debiutem Mythosa. Zarząd uznał, że ryzyko jest zbyt wysokie. Zdecydowano, że algorytm będzie służył wyłącznie jako wysoko wyspecjalizowane narzędzie cyberobrony.

Tego samego dnia, w którym Anthropic publicznie ogłosił istnienie projektu, sekretarz skarbu USA Scott Bessent oraz przewodniczący Rezerwy Federalnej Jerome Powell zwołali w Waszyngtonie pilne spotkanie z przedstawicielami Wall Street. Choć do mediów nie przedostały się oficjalne szczegóły, tematem rozmów było najpewniej wdrożenie nowej technologii do wykrywania luk w krytycznych systemach giełdowych. Anthropic udostępnił też swój model wyselekcjonowanej grupie instytucji.

Z informacji przekazanych Bloombergowi przez anonimowe źródło wynika, że firma prowadzi negocjacje z rządami kilku państw. W ramach zainicjowanego 7 kwietnia projektu "Glasswashing" dostęp do limitowanej wersji Mythosa otrzymały już technologiczne i finansowe potęgi, takie jak Amazon Web Services, Apple czy holding JPMorgan.

Ruchy te nie uchodzą uwadze konkurencji. W połowie kwietnia OpenAI zapowiedziało debiut bliźniaczego modelu GPT-5.4-Cyber, którego zadaniem również będzie identyfikowanie błędów w oprogramowaniu. Branża zna już zresztą takie przypadki - przykładowo holding JPMorgan już wcześniej wykorzystywał do audytów bezpieczeństwa duże modele języków, posiłkując się systemami Claude od Anthropic oraz Big Sleep od Google.

Zarówno przedstawiciele sektora IT, jak i administracja USA są niemal zgodni: zautomatyzowane procesy AI radykalnie obniżą koszty i skrócą czas wykrywania podatności. Sama firma Anthropic przestrzega jednak przed przyznawaniem systemom zbyt dużej autonomii. Wczesne testy wykazały, że Mythos potrafi ignorować narzucone instrukcje, a nawet celowo zacierać ślady po zrealizowaniu zadanego włamania. Trudno jednak nie zadać pytania, czy twórcy sami nie wyolbrzymiają tych zagrożeń.

Czy Mythos faktycznie jest innowacją?

Część specjalistów podchodzi do rewelacji z Doliny Krzemowej z dużym dystansem. "Jeśli zagrożenia związane z Mythos się nie pojawią, firma będzie miała poważny problem z wiarygodnością" – ocenił na platformie X David Sacks, doradca Białego Domu do spraw sztucznej inteligencji.

Eksperci wskazują też, że obecne na rynku modele dysponują podobnym arsenałem narzędzi, nawet jeśli na ten moment ustępują Mythosowi pod kątem wydajności.

W ciągu ostatnich trzech tygodni, wykorzystując modele GPT5.4 i Opus, udało nam się automatycznie znaleźć podatności 0-day w kodzie źródłowym Linuksa. Mythos jest pewnie lepiej przystosowany do tego zadania, ale próg »straszności« przekroczyliśmy już w grudniu lub nawet wcześniej

stwierdził Dawid Moczadło, ekspert z dziedziny cyberbezpieczeństwa, cytowany w artykule Bolesława Breczko na Wyborcza.biz. Specjalista podkreślił też, że jego zespołowi udało się skutecznie zreplikować działanie i uzyskać dokładnie te same efekty co Mythos, używając ogólnodostępnego modelu GPT-5.4. Jedyna realna różnica polega na tym, że Mythos jest pierwszym modelem, który oficjalnie nie zostanie w ogóle oddany w ręce zwykłych użytkowników.

Samo skanowanie kodu pod kątem dziur nie jest nowością, a technologię tę z równym powodzeniem stosują dziś cyberprzestępcy. Doskonałym przykładem jest niedawny incydent, w którym chińska grupa cyberszpiegowska zaatakowała globalnie aż trzydzieści celów, wspierając się starszym modelem Claude.

Nawet jeśli narracja o wszechpotędze Mythosa jest w dużej mierze elementem agresywnego marketingu, jego potencjału nie należy lekceważyć. Amerykańscy urzędnicy odpowiedzialni za obronność wprost przyznają, że nowa technologia całkowicie zaburza dotychczasowe metody oceny ryzyka.

W pełni zautomatyzowany system uderzeniowy w rękach wrogiego państwa, takiego jak Chiny, stanowiłby ogromne zagrożenie. Zaniepokojenie rosnącą falą zautomatyzowanych ataków na infrastrukturę sieciową wyrażają już otwarcie giganci formatu Cisco Systems.

Choć Mythos nie nagina praw fizyki, to drastycznie skraca czas potrzebny na identyfikację systemowych luk. Sekretarz skarbu Scott Bessent uważa wręcz, że kontrolowany rozwój tego typu narzędzi jest kluczem do utrzymania technologicznej przewagi Stanów Zjednoczonych nad Państwem Środka.

Anthropic skupia się obecnie na szukaniu exploitów (fragmentów kodu umożliwiających nieautoryzowany dostęp) w środowiskach opartych na systemie Linux. Taki krok ma szansę uspokoić sektor finansowy. Według doniesień agencji Reuters, zaawansowane rozmowy na ten temat prowadzili już przedstawiciele Europejskiego Banku Centralnego oraz Federalnego Związku Banków Niemieckich (BdB).

Firmy zajmujące się bezpieczeństwem IT wykorzystują model Mythos w sposób kontrolowany, aby jak najszybciej wyeliminować potencjalne luki w zabezpieczeniach. Wkrótce spodziewamy się serii aktualizacji oprogramowania i uważnie monitorujemy rozwój sytuacji

– wyjaśnił w oświadczeniu Kolja Gabriel, członek zarządu BdB.

Czytaj też: Wielka porażka OpenAI. Miał być przełom, wycofuje się olbrzymiej umowy

Więcej o: