Streszczenie
Każdy ma incydenty. Jeśli uruchomisz dowolny system o podstawowym rozmiarze, w pewnym momencie zakończy się to niepowodzeniem i wystąpi awaria. To tylko fakt. Dlatego reagowania na zdarzenia jest drugim poziomem w hierarchii niezawodności Dickersona bezpośrednio po monitorowaniu.
Następnie staje się pytanie: Jak reagujesz w tych momentach? Czy reagujesz w trybie pilnym przy użyciu ustalonego planu lub procesu, czy masz reakcję ad hoc? Wiemy z dobrych badań w tej dziedzinie, że czas odzyskiwania jest jednym ze wskaźników wysokiej wydajności organizacji. Dobry proces reagowania na zdarzenia ma kluczowe znaczenie dla skrócenia tego okresu odzyskiwania.
W tym module przyjrzeliśmy się etapom zdarzenia i zapoznaliśmy się z niektórymi kluczowymi składnikami planu reagowania na zdarzenia dla każdego z tych etapów. Omówiliśmy znaczenie śledzenia zdarzeń dobrze i sposobów automatyzowania tego procesu przy użyciu narzędzi dostępnych na platformie Azure. Przyjrzeliśmy się również kluczowym aspektom komunikacji podczas zdarzenia. Na koniec zapoznaliśmy się z niektórymi narzędziami, które zapewnia platforma Azure, które mogą pomóc Twojej organizacji w bardziej wydajnym korygowaniu zdarzenia.