Podsumowanie

Ukończone

W tym module szczegółowo omówiliśmy przegląd po zdarzeniu. To jedno z najpotężniejszych narzędzi pozwalających zamienić nieuniknione awarie w okazję do poprawienia jakości naszych praktyk operacyjnych. Jest to kluczowa część zwiększania niezawodności.

Poznaliśmy kilka aspektów złożonych systemów, które sprawiają, że awarie są w takich systemach nieuniknione. Z tego powodu warto skupiać się nie tylko na zapobieganiu katastrofie, ale również na sposobach reagowania na nią, gdy już się wydarzy. Jest to dla nas zachęta do wyszukiwania i wykorzystywania narzędzi, które pomagają udoskonalać tę reakcję w ramach fazy analitycznej w cyklu życia zdarzenia.

To w tej fazie wykonuje się przegląd po zdarzeniu. Po zapoznaniu się z dobrym poczuciem tego, czym jest przegląd po zdarzeniu (i nie jest) oraz jego celem, upewniliśmy się, że zapoznaliśmy się z charakterystykami i składnikami, które są potrzebne do jej skutecznego działania.

Następnie omówiliśmy sam proces oraz narzędzia dostępne na platformie Azure, które pomogą go rozpocząć.

Aby poprawić szanse na sukces, zbadaliśmy, jak uniknąć typowych pułapek, w których ludzie wchodzą podczas uruchamiania przeglądów po zdarzeniu, oraz kilka dobrych rozwiązań, których można użyć, aby ułatwić przeglądy po zdarzeniu spektakularny sukces.