Sprzątanie po e-katastrofie. Czy Beyond.pl uda się przywrócić dane i dobre imię

Robert Kędzierski
05.06.2012 10:28
A A A
Serwis e24cloud - podniesie się czy pociągnie za sobą Beyond.pl

Serwis e24cloud - podniesie się czy pociągnie za sobą Beyond.pl (Fot. e24cloud/ sxc.hu/ Robert Kędzierski)

W poniedziałek w serwerowni Beyond doszło do dwóch katastrof. Na skutek awarii zasilania jeden po drugim padały kolejne polskie serwisy. Co gorsza jeden z nich e24cloud.com (należący do Beyond) stracił macierz dyskową oraz backup. Odzyskanie danych wcale nie jest pewne, a przecież nie takich wiadomości spodziewa się ktoś powierzający swój internetowy los jednej z największych firm hostingowych w kraju.

Spokojnie, to tylko awaria

Beyond.pl to (wciąż używamy czasu teraźniejszego) jedna z największych firm hostingowych w naszym kraju, powołana do życia siedem lat temu, ma siedzibę w Poznaniu. Oferuje serwerownie, cloud computing, serwery dedykowane, streaming danych. Na jej serwerach przechowywała niegdyś dane Nasza Klasa, a i dziś na liście klientów firmy są wielkie nazwy: PayU, Wykop, Oferia, Natemat, Allegro, Media Markt i wiele innych.

Beyond

W poniedziałek rano podczas testów licznych instalacji znajdujących się serwerowni doszło do awarii jednej z nich - zasilania.

Michał Grzybkowski, prezes Beyond, tłumaczy w wystąpieniu umieszczonym na firmowej stronie:

„Beyond.pl jest serwerownią, która spełnia wymogi Tier IV, najbardziej restrykcyjne wymagania dotyczące bezpieczeństwa. Dzisiaj [w poniedziałek - red ] o godzinie 7.35 podczas rutynowego testu zasilania jedna z linii zasilających miała kilkuminutową przerwę. Udało się nam bardzo szybko przywrócić zasilanie, już przed godziną 8 serwerownia była w pełni operacyjna”.

Dalej słyszymy o tym, że gigantyczny agregat, który czuwa nad bezpieczeństwem całej struktury zadziałał jak trzeba i wszystko powoli wraca do normy. Tymczasem przecież doszło do odcięcia zasilania od serwerów, a to w ogóle - według normy Tier IV - nie powinno mieć miejsca. Na stronie monitoring-serwerowni.pl czytamy: Tier IV składa się z wielu aktywnych instalacji zasilających, posiada komponenty nadmiarowe i jest odporna na uszkodzenia, zapewnia 99,995% dostępności.

Piorunem w chmurę

Prezes Grzybkowski nie wspomina o drugiej katastrofie. Należący do Beyond serwis e24cloud.com - od jesieni zeszłego roku oferujący profesjonalny, komercyjny hosting "w chmurze" - ucierpiał w znacznie większym stopniu. "Rany", które odniósł są niemal śmiertelne. Okazało się, że podczas wspomnianej awarii zasilania doszło do uszkodzenia macierzy dyskowej. Co gorsza - również backupu. Prawdopodobnie uszkodzeniu uległ cały system RAID, wynika więc z tego, że kopia zapasowa nie znajdowała się na innym urządzeniu. A chyba powinna. Powinna też - jak czytamy na blogu sysadminblog.pl mieć niezależną linię zasilającą.

Koszmar każdego właściciela portalu internetowego ziścił się: odzyskiwanie danych leży teraz w gestii specjalistów od uszkodzonych dysków, a wiadomo, że tego typu procedura jest niezwykle czasochłonna i kosztowna.

Na stronie spidersweb.pl czytamy wypowiedź Piotra Dembińskiego z firmy Kroll Ontrack, która podjęła się próby odzyskania danych:

Z reguły nie ma najmniejszych szans na odzyskanie 100% danych. Średnia skuteczność to 76%. W najlepszych polskich przypadkach taka skuteczność dochodzi do 80%. Na pytanie o doświadczenie w odzyskiwaniu danych dla polskich serwisów hostingowych, Dembiński poinformował nas, że w ostatnich dwóch latach Kroll Ontrack pomagał w dwóch takich przypadkach. O skuteczności tych operacji nie chciał mówić. Dodał, że taka operacja jest też z reguły dość czasochłonna - w zależności od skali zniszczeń, profesjonalne odzyskiwanie danych z macierzy dyskowej trwa od jednego dnia do tygodnia, a nawet dłużej.

Klienci e24cloud.com zaufali zapewnieniom o 100% bezawaryjności, o spełnieniu restrykcyjnej normy Tier IV, która nakazuje w przypadku awarii podtrzymanie zasilania przez 24 godziny a zaleca przez 72.

Pomimo zapewnień doszło do uszkodzenia zarówno danych jak i kopii bezpieczeństwa. Jak? Tego nikt z firmy nie tłumaczy rozgoryczonym klientom, którzy nie szczędzą ostrych sformułowań zirytowani szczególnie kiepską komunikacją ze strony Beyond. Na YouTube czytamy:

„Daliście ciała i? nawet nie potraficie przyznać się do tego uczciwie i powiedzieć co naprawdę spieprzyliście, tylko rzucacie jakąś tanią ściemę. "
„W momencie, kiedy z jednej strony słyszę przechwałki o spełnianiu standardów Tier 4, a z drugiej pojawiają się informacje o wożeniu dysków z danymi oraz backupami do odzysku czy też informacje o serwisach, które nie wstały od pół doby, to sam przyznasz, że to śmierdzi. A jedynym oficjalnym wyjaśnieniem ze strony Beyond jest jakaś niejasna paplanina o awarii zasilania.”

Sieć nie jest więc dla firmy zbyt łaskawa, znalazły się jednak opinie bardziej stonowane:

„nie rozgrzeszam ich tylko na chwilę obecną mamy za mało danych żeby ferować wyroki. Podejrzewam, że będą musieli przemyśleć projekt infrastruktury oraz opis usługi, żeby klienci wiedzieli co kupują."

Beyond

Czy chmura jest ze szkła?

Klienci byli bowiem przekonani, że kupują 100% pewność utrzymania danych. Dlaczego teraz muszą liczyć na najwyższej klasy specjalistów od odzyskiwania danych? Czy Beyond.pl mogło uniknąć wpadki i czy wie już co tak naprawdę się stało? Czy e24cloud.com działało w oparciu o infrastrukturę funkcjonującej według normy Tier IV? Gdyby tak było do uszkodzenia danych chyba by nie doszło.

Warto na koniec wspomnieć, że podobne awarie zdarzają się największym. W listopadzie 2007 roku ciężarówka staranowała transformator i odcięła zasilanie w jednym z największych amerykańskich data center - RackSpace. Na kilka godzin zniknęło wiele serwisów, między innymi GigaOM. Swoje wpadki zaliczają też Amazon, Google, Facebook. Dlatego też rozsądne jest tworzenie własnych kopii bezpieczeństwa i nie ufanie nikomu. Bez względu na to, co obiecuje podczas podpisywania umowy. Chmura nie jest niezniszczalna.

Wpadka Beyond.pl jest jednak szczególnie bolesna. Podważa zaufanie do chmury, która przecież dopiero zaczyna nabierać znaczenia. W wywiadzie udzielonym Money.pl w 2011 prezes Beyond.pl przewidywał:

„Być może już za trzy lata nikt nie będzie kupował serwerów [..] Producenci i dystrybutorzy serwerów mają wielki orzech do zgryzienia, bo z milionów, liczba ich klientów na świecie stopnieje do, powiedzmy, stu - pięciuset. I to będą właśnie dostawcy rozwiązań chmurowych.”

Wciąż trwa liczenie strat, Beyond.pl obiecuje, że "nikogo nie pozostawi samemu sobie". Walczy o swój dalszy los, nie ma innego wyjścia.

Rankiem na profilu Facebooka firma umieściła następujące wpisy:

Drodzy użytkownicy, informujemy, że zainstalowanych zostało 33% maszyn. Dane z backupów, które zostały wykonane z poziomu panelu przez Użytkowników, będą dostępne po starcie serwisu. Prace nad odzyskiwaniem reszty trwają.

oraz

Dane z backupów wykonanych przez Użytkowników, będą dostępne po starcie serwisu. Prace nad resztą trwają.

Co jednak z odzyskaniem danych z uszkodzonej macierzy? Co z przyczynami "katastrofy"? Czekamy na wyjaśnienia.

 

[ Aktulizacja ]

E24cloud nie zamierza uciekać od odpowiedzialności, wydało następujące oświadczenie.

"Szanowni Klienci - jako poważne przedsiębiorstwo nie uciekamy od odpowiedzialności biznesowej i zamierzamy zrekompensować naszym Klientom niedogodności związane z awarią. Zapewniamy ze - natychmiast po zakończeniu wszelkich prac technicznych związanych z testami ponownie uruchomionych systemów, przystąpimy do indywidualnego ustalania sposobu rekompensowania faktu niedostępności serwisów. Jednocześnie wprowadzamy usługę jednorazowego - darmowego backupu dla wszystkich naszych klientów. Dziękujemy za wsparcie i pomoc.”

Na blogu niebezpiecznik.pl można też znaleźć opis zaistniałej sytuacji bliższy - według zainteresowanej firmy - temu, co się wydarzyło. Choć w komentarzach widocznych pod wpisem słychać niedowierzanie wobec niektórych przedstawionych faktów. Część klientów wciąż ma do e24cloud pretensje pomimo przywrócenia działania samego serwisu.

 

[ Aktualizacja ] 15:57

Niestety, wiele danych zostało utraconych bezpowrotnie. Na profilu e24cloud czytamy:

Jeśli chodzi o odzyskiwanie danych, to sprawa jest poważna (prawdopodobnie straciliśmy 60% dysków z grupy raidowej). Nasi inżynierowie są cały czas w kontakcie ze specjalistami z Ontracka i w tym momencie trudno jest określić, jak długo potrwa odzyskiwanie. Nie chcemy podawać sztucznych terminów, których możemy nie dotrzymać. Prosimy o wyrozumiałość. Będziemy Wam przekazywali każdą nową informację.
Komentarze (68)
Zaloguj się
  • kazimierz

    Oceniono 19 razy 15

    Wyjątek z zakładki e24cloud.com - wsparcie - pytania i odpowiedzi:

    Czy dane na serwerze w chmurze są bezpieczne?
    Cała infrastruktura używana do tworzenia serwerów w chmurze jest umiejscowiona w najnowocześniejszym datacenter - Beyond.pl. Zabezpieczenia, jakie stosujemy są bardzo rozbudowane: dotyczą sprzętu (gwarantujemy jego sprawność), zasilania (np. zasilanie awaryjne, redundantne zasilacze), łączy (kilka zapasowych łączy o wysokiej stabilności), danych (firewalle, backupy). Każdy użytkownik otrzymuje wydzielone środowisko serwerowe, którego poszczególne elementy (CPU, RAM, czy HDD) nie są współdzielone z innymi użytkownikami, a połączenie z każdym serwerem odbywa się w sposób szyfrowany (SSL). Każdy użytkownik powinien jednak pamiętać o zabezpieczeniu systemu operacyjnego swojego serwera w chmurze tak samo, jak na każdym innym komputerze czy serwerze.

    HA HA HA

  • pstepniewski

    Oceniono 14 razy 12

    Niestety, prawda jest bolesna - chmura nie zapewnia 100% bezpieczeństwa danych. Kopia zawsze powinna znajdować się w fizycznie innym miejscu. Najlepiej poza serwerownią firmy hostingowej. W przypadku bardzo dużych serwisów, z przepastną ilością danych, może być to problemem... Jeśli jednak mówimy o serwisach zajmujących po kilka, kilkanaście GB - warto robić kopie z automatu i przesyłać na jakiś inny hosting, najlepiej do innej firmy w postaci np. ZIPa. Albo gromadzić na własnych dyskach w firmie/domu.
    Nigdy nie ma 100% skuteczności i bezpieczeństwa, ale świadomie można zbliżyć się do tego progu.
    A bajki w stylu "100% bezpieczeństwa danych naszych Klientów" to... bajki. Ufają nim głownie ludzi z brakiem doświadczenia dający się wmanewrować przez marketingowców obiecujących cud-miód-orzeszki.
    Ufać trzeba w takich wypadkach najpierw sobie, a potem zdawać się na zapewnienia innych. Dynamicznie zbierane dane są niestety nie do odtworzenia jeśli nie mają kopii... A chyba na takich własnie danych dziś opiera się niemal każdy serwis czy usługa w sieci.
    Pozdrawiam i życzę powodzenia firmie, aby jednak przywróciła zasoby Klientów. A aby Ci mogli zdecydować - zostajemy czy się żegnamy i zmieniamy "grajdół" na inny.

  • Oceniono 16 razy 12

    To jest właśnie chmura. Trochę nieuwagi oraz braku solidności ze strony firmy hostującej powoduje katastrofę wielu firm. Straty będą bardzo duże. Można spodziewać się pozwów o stracone korzyści z powodu braku strony w Internecie. Koszty pozycjonowania stron też nie są małe. Firma może zwijać swoje tobołki.

  • Gość: pix_x

    Oceniono 9 razy 9

    W Czarnobylu też były rutynowe testy i skończyło się jak skończyło :)))

  • ja_to_nie_ja_raj

    Oceniono 9 razy 9

    Jedyny w miarę pewny backup to na taśmę i duplikacja od razu do lokalizacji zapasowej. Wszelkie rozwiązania raid to nie są rozwiązania które zapewniają jakikolwiek backup - to po prostu jedno z wielu rozwiązań jeśli chodzi o optymalizacje przechowywania danych ... Oczywiście w porządnych rozwiązaniach dane na macierzy sa w trybie rzeczywistym duplikowane do lokalizacji zapasowej - wtedy nawet utrata całej macierzy w ośrodku podstawowym nie jest dramatycznie grozna.

  • georgeb

    Oceniono 13 razy 7

    Pewnie wymogi Tier IV są tak niskie, że wystarczy wszystko drutem powiązac i jakoś to bedzie.
    Mogą teraz zwijac interes. Trudno, jeśli ktoś nie posiada minimum wyobraźni, to niech zaczyna wszystko od nowa. Przyroda jest nieubłagalna. Wystarczy mały błąd i jesteś już nikim.

  • kontra.punkt

    Oceniono 7 razy 7

    Być może przyczyna jest banalna, podobna do tej sprzed kilku(nastu) lat a dotycząca nieistniejącego już serwisu polbox.com.
    Ludzie są tylko ludźmi a bycie administratorem jest bardzo stresującym zajęciem...

  • luki349

    Oceniono 8 razy 6

    Nie wiem czemu wszyscy zakładają, że przyczyną był zanik zasilania, skoro symptom wskazują na spięcie.
    Tier IV chroni przed nagłym zanikiem zasilania, ale nie istnieje taki system, który chroni przed mocny spięciem, przepięciem, itp. Po prostu doszło do spięcia, w wyniku czego serwery się zresetowały, a cześć z nich się zjarała i ot cały problem.

  • gazeta.p1

    Oceniono 7 razy 5

    Przepraszam, proszę o erratę:

    "od jesieni zeszłego roku oferujący profesjonalny, komercyjny hosting "w chmurze"

    TO NIE JEST PROFESJONALNY HOSTING W CHMURZE!

Aby ocenić zaloguj się lub zarejestrujX