Dlaczego Facebook i Messegner nie działały? Setki tysięcy zgłoszeń

We wtorek doszło do globalnej awarii usług należących do koncernu Meta. Wielu użytkowników zostało automatycznie wylogowanych z takich serwisów, jak Facebook, Instagram i Messenger. Niektórzy obawiali się, że doszło do włamania na ich konta.
Facebook
Fot. REUTERS/Dado Ruvic

We wtorek po południu użytkownicy Facebooka, Messengera i Instagrama na całym świecie doświadczyli poważnych problemów z działaniem tych aplikacji. Wielu z nich zostało automatycznie wylogowanych z serwisów, co zrodziło obawy, że doszło do włamania na ich konta. Niektórzy próbowali w związku z tym zresetować hasła, ale to nie rozwiązało problemu. Okazało się bowiem, że doszło do globalnej awarii wszystkich serwisów należących do koncernu Meta.

Zobacz wideo Adrian Hołota: Będzie się pogłębiał trend subskrypcji codzienności

Raporty na downdetector.pl zaczęły masowo spływać po godzinie 16:00. Ich liczba bardzo szybko rosła. O 16:17 było ich już ponad 76 tysięcy, do 16:30 liczba ta wynosiła już przeszło 199 tysięcy zgłoszeń. W szczytowym momencie zgłoszeń dotyczących awarii było już ponad 500 tys., co jest sytuacją wręcz niespotykaną. 

Co się dzieje z Messengerem? Globalna awaria

We wtorek późnym popołudniem Andy Stone, rzecznik Mety przyznał, że firma jest świadoma problemów z dostępem do jej usług. "Pracujemy nad rozwiązaniem problemu" - dodał. Awaria została opanowana po godzinie 17:30 czasu polskiego. Zdaniem samej Mety winę za nią ponosi "techniczna usterka".

Dzisiaj rano wystąpił problem techniczny, który spowodował, że ludzie mieli trudności z dostępem do niektórych naszych usług. Rozwiązaliśmy go tak szybko, jak to możliwe i przepraszamy za wszelkie niedogodności.

- stwierdził Andy Stone we wpisie opublikowanym w serwisie X. Firma Marka Zuckeberga nie zdobyła się jednak na wyjaśnienie, o jaką dokładnie usterkę chodziło.

Elon Musk szydzi z Facebooka. "Jeśli to czytasz, to znaczy, że nasze serwery działają"

W związku z awarią Facebooka i Instagrama należący do Elona Muska serwis X odnotował we wtorek znaczący wzrost ruchu. Wiele osób właśnie tam szukało informacji na temat przyczyn awarii usług Mety.

Elon Musk postanowił skorzystać z okazji, aby wyszydzić swego rywala Marka Zuckerberga. "Jeśli czytasz ten wpis, to znaczy, że nasze serwery działają" - napisał. Następnie opublikował dość jednoznacznego mema ze słynnymi pingwinami z Madagaskaru.

To nie była największa awaria Facebooka

To nie pierwsza poważna awaria Facebooka. W październiku 2021 r. miał miejsce zdecydowanie większy "blackout", który trwał aż sześć godzin. Wtedy winnym okazała się błędna aktualizacja protokołu BGP, który stanowi podstawę działania współczesnego internetu. System ten "steruje" ruchem w sieci i decyduje o tym, jaką trasę mają obrać poszczególne pakiety danych, aby jak najszybciej dotrzeć z miejsca A do miejsca B. 

Dlaczego pracownikom Facebooka tak długo zajęło uporanie się z problemem? Okazuje się, że powody były dość kuriozalne. Jak wyjaśnił Alex Hern, dziennikarz technologiczny "Guardiana", w serii wpisów na Twitterze, winna okazała się wewnętrzna polityka firmy, której wszystkie systemy działają w oparciu o serwery Facebooka. 

Facebook przypadkowo wysłał aktualizację protokołu trasowania (deep-level routing protocol) , która w uproszczeniu mówi: 'Hej, nie mamy już żadnych serwerów' (...). Zazwyczaj, taki błąd można w łatwy sposób naprawić, wystarczyłoby wysłać kolejną aktualizację protokołu mówiącą w uproszczeniu: 'Nie martwcie się. Mamy jednak serwery. Są tutaj!'

- tłumaczy dziennikarz.

Sęk w tym, że wysłanie takiej aktualizacji okazało się niemożliwe, gdyż, jak wyjaśnia Hern, "w Facebooku WSZYSTKO działa przez Facebooka". W efekcie zdalna naprawa problemu okazała się niemożliwa, gdyż serwery Facebooka zostały niejako odcięte od świata zewnętrznego. Aby uporać się z awarią, pracownicy FB musieli fizycznie pojawić się w serwerowni firmy i dokonać restartu serwerów.

Tu pojawił się kolejny problem. Otwarcie drzwi do serwerowni okazało się niemożliwe, gdyż karty dostępu... również działają w oparciu o serwery Facebooka. Problem mógł rozwiązać szef ochrony, który dysponował fizycznym kluczem. Jednak tu znów coś poszło nie tak, bo system alarmowy, który umożliwia szybki kontakt z szefem ochrony - tak, zgadliście - działa na serwerach Facebooka.

Dlaczego...? 

W cyklu "Dlaczego..." staramy się odpowiadać na najpopularniejsze oraz najbardziej aktualne pytania, z którymi mierzą się nasi czytelnicy. Jeśli chcecie wiedzieć "Dlaczego...", możecie wysyłać wasze pytania pod adres next.redakcja@agora.pl

Więcej o: