Procedury kapitana Wrony

Awaryjne lądowanie kapitana Wrony to przykład na to jak procedury na wypadek sytuacji awaryjnej zadziałały. W lotnictwie to się zdarza, w IT prawie nigdy. Winą jest nie tylko brak procedur, ale też brak woli ich wdrażania i przestrzegania. Dlaczego tak jest i czy można to zmienić?

Pomiędzy zastosowaniami informatyki a lotnictwem cywilnym jest oczywiście jedna podstawowa różnica - w rękach lotników bezpośrednio spoczywają ludzkie życia, w rękach informatyków - zazwyczaj tylko powodzenie biznesu. Jednak wraz z informatyzacją wszystkiego, nie trzeba będzie wsiadać do samolotu, aby oddać swoje życie w "ręce" komputera. Niedługo wsiądziemy do samochodu, wybierzemy adres w Google Maps a wóz samodzielnie zawiezie nas do domu. Zamiast jeździć do odległego szpitala na trudną operację, lekarz wykona ją zdalnie za pomocą robota. Co, jeśli nagle zerwie się połączenie?

Kapitan Wrona miał procedury, miał instrukcję postępowania w sytuacjach awaryjnych, miał wreszcie lata doświadczenia, trening na symulatorach. Współczesne sieci są bardzo skomplikowane, każda jest inna, zbudowanie symulatora byłoby bardzo trudne i kosztowne jeśli nie niemożliwe.

Jest na świecie kilka firm informatycznych zdających sobie z roli jaką pełnią i ponoszonej przez to odpowiedzialności. Prowadzą szkolenia i ćwiczenia, uczące pracowników co robić w razie awarii, sprawdzające czy usługa będzie działać, jeśli jedna z serwerowni przestanie działać. Ale w wypadku mniejszych firm proste ćwiczenie - wyłączenie prądu, żeby sprawdzić czy zastartuje zasilanie awaryjne - często staje się ćwiczeniem procedury uruchamiania wszystkiego po awarii zasilania, bo generator awaryjny nie odpalił.

To z kolei prowadzi do rezygnacji z takich prób, bo takie przestoje generują koszty. więc po co ryzykować, przecież wszystko będzie dobrze. A potem nadchodzi dzień wielkiej awarii, piorun pali całą serwerownię, informatycy sięgają do backupów - i okazuje się że backupy są, ale nie da się ich odtworzyć, albo nie ma wszystkiego co potrzebne.

Mój znajomy odbierał kiedyś wielki projekt informatyczny od podwykonawcy. Podwykonawca miał zapewnić to co inżynierowie nazywają redundancją - taką konstrukcję połączeń i zależności między serwerami, oraz taki "zapas mocy" że awaria jednego z nich nie spowoduje zatrzymania całości. Mój znajomy poszedł więc do serwerowni, odszukał szafę, w której znajdowały się komputery utrzymujące cały system i wyciągnął z gniazdka pierwszy z brzegu kabel zasilający. System nie przeżył tego testu, a pracownicy podwykonawcy nie za bardzo rozumieli co jest powodem nie przyjęcia odbioru systemu. Przecież niektóre połączenia można było rozłączyć tak żeby wszystko dalej działało.

To prawda, nie był to ani system medyczny, ani elektrownia jądrowa. Ale dzięki usługom tego typu rzesze zwykłych ludzi zarabiają na życie, każdy przestój to dla nich strata przychodu. Na taką usługę użytkownicy muszą móc liczyć.

Przed nami jeszcze długa droga, zarówno w zastosowaniach informatyki jak i w gotowości dziedziny i ludzi w nią zaangażowanych na wzięcie w swoje ręce ludzkiego życia.

Internet? To przecież tylko śmieszne obrazki z kotami.

Więcej o: