什么是事后回顾?

已完成

我们在此学习路径所含的一个前置模块中提到过,但这里再次快速回顾,事件的生命周期如下所示:

使用上述阶段标记的圆形循环图,圆圈通过箭头彼此连接,表示从一个阶段到另一个阶段

事件将经历以下几个阶段:

  • 检测:首次发现存在问题时(理想情况下,是在客户通知或投诉之前,在我们的监视系统中发现);
  • 响应:立即进行操作,按照事件响应流程,尝试会审情况并进行紧急响应。
  • 修正:努力确定问题,并努力使系统或服务恢复正常运行。
  • 分析:事件发生后,尝试从经验中学习,也许可以确定系统或流程中需要改变之处。
  • 准备情况:根据汲取的教训进行更改,以提高可靠性并改进相关上下文(流程等)。

本模块的主题大部分都发生在分析阶段。 我们进行事后回顾以从事件中汲取经验。

每次重大事件后都应进行事后回顾。

尽管正式回顾发生在响应和补救阶段之后,但在收到事件发生的可操作警报时就要立即为分析铺路,通知团队成员,并开始围绕事件进行对话。

定义事后回顾

并非每个人都使用完全相同的语言来表示这一过程。 有些人称之为:

  • 事后回顾
  • 事后学习回顾
  • 事件调查报告
  • 追溯

在此模块中,我们将使用术语“事后回顾”。

此外,并非每个人都以完全相同的方式进行事后回顾。 例如,许多人会先将与事件有关的所有人聚到一起,而其他人会选择通过单独访谈来创建回顾报告,然后再报告给群组。

如果组织中的团队架构使得难以召开单个大型会议,后一种方法通常效果更好。 例如,如果各个组的活跃性、个性和跨时区团队的分散性会妨碍这种集会,那么使用另一种方式来进行回顾可能会更容易。 应该采用最适合你的团队和环境的方式。

无论你怎么命名、怎么组织这一过程,都有三个要点:

  • 应尝试让事件响应中涉及的所有人参与事后回顾。 包容所有人的意见非常重要,因为不同的人对同一件事会有不同的观点和记忆。
  • 应在事件发生后的 24 到 36 小时内进行事后回顾。 神经科学已经确认人类记忆相当不可考:人是健忘的。 事件之后经过的时间越久,能想起的细节和具体回忆就越少。
  • 事件评审不能包含指责。 我们将在下一单元中详细介绍这一点。

事后回顾的目的

事后回顾的目标是让你的团队能够学习和改进。 你需要了解系统,还要了解你准备的措施中哪些有效、哪些无效,才能进行改进。

同时,应当记住,你生成的操作项(报表、任务、bug 报告、票证、反馈)很有用,但并不是回顾过程的核心,核心在于学习和改进。 生成操作项列表最多是第二目标。

知识检查

1.

以下哪个选项是可以帮助我们从失败中汲取经验和教训的过程的正确名称?

2.

事后回顾发生在事件生命周期的哪个阶段?

3.

理想情况下,应该在什么时候进行事后分析?