まとめ
誰にでもインシデントは発生します。 基本的にどのようなサイズのどのようなシステムでも、実行するとどこかの時点で障害が発生して停止します。 これは事実です。 このため、ディッカーソンの信頼性の階層で、"インシデント対応" は監視に次ぐ第 2 レベルになっています。
そこで次の質問が浮かびます。そのとき、どのように対応しますか?定められた計画またはプロセスに沿って緊急に対応しますか、またはアドホックで対応しますか。 この分野における優れた研究から、復旧時間はパフォーマンスの高い組織の指標の 1 つであることがわかっています。 この復旧期間を短縮するには、インシデント対応の適切なプロセスを用意することが重要です。
このモジュールでは、インシデントの段階を調べ、各段階のインシデント対応計画の主要なコンポーネントをいくつか取り上げました。 インシデントを適切に追跡できることの重要性と、Azure で提供されるツールを使用して、そのプロセスを自動化する方法について説明しました。 また、インシデント中の連絡の主要な側面も見てきました。 最後に、インシデントの修復中に組織の効率を高めるのに役立つ、Azure が提供するいくつかのツールについて説明しました。