Postmortem-Analysen ohne Schuldzuweisungen
Organisationen, die DevOps einsetzen, möchten Fehler und Irrtümer betrachten, um daraus zu lernen. Zu diesem Ziel gehört es, Postmortem-Analysen ohne Schuldzuweisungen für Ausfälle und Unfälle durchzuführen.
Eine gerechte Kultur zu haben bedeutet, dass Sie sich um ein Gleichgewicht zwischen Sicherheit und Verantwortlichkeit bemühen. Das bedeutet, dass eine Organisation durch die Untersuchung von Fehlern in einer Weise, die sich auf die situationsbedingten Aspekte eines Fehlers und auf den Entscheidungsprozess von Personen konzentriert, die mit dem Fehler in Verbindung stehen, sicherer hervorkommen kann, als wenn sie die beteiligten Personen bestraft hätte.
Eine Postmortem-Analyse ohne Schuldzuweisungen bedeutet, dass Techniker, deren Handlungen zu einem Unfall beigetragen haben, detailliert zu Folgendem Rechenschaft ablegen können:
- Welche Aktionen sie zu welchem Zeitpunkt durchgeführt haben.
- Welche Effekte sie beobachtet haben.
- Welche Erwartungen sie hatten.
- Welche Annahmen sie getroffen haben.
- Ihr Verständnis für den zeitlichen Ablauf der Ereignisse, wie sie aufgetreten sind.
Es ist wichtig, dass sie diesen detaillierten Bericht ohne Angst vor Strafe oder Vergeltung vorlegen können.
Ein Techniker, der erwartet gerügt zu werden, hat keinen Anreiz, eine realistische, genaue Darstellung des Problems zu geben. Wenn nicht verstanden wird, wie es zu einem Unfall gekommen ist, ist so gut wie garantiert, dass er noch einmal passieren wird – wenn nicht mit dem ursprünglichen Techniker, dann mit jemand anderem.
„Wir müssen uns bemühen zu verstehen, dass Unfälle nicht passieren, weil Personen spielen und verlieren. Unfälle passieren, weil die Person an Folgendes glaubt:
...was passieren wird, ist nicht möglich, ...was passieren wird, steht in keinem Zusammenhang mit dem, was sie gerade tun ...oder dass die Möglichkeit, das beabsichtigte Ergebnis zu erzielen, jedes Risiko wert ist.“
— Erik Hollnagel
Gestatten Sie Technikern, ihre eigene Geschichte zu schreiben.
Etwas Lustiges passiert, wenn Techniker Fehler machen und sich sicher fühlen, wenn sie Details dazu preisgeben. Sie sind nicht nur bereit, zur Verantwortung gezogen zu werden, sie sind auch mit Begeisterung dabei, dem Rest des Unternehmens zu helfen, denselben Fehler in Zukunft zu vermeiden. Sie sind schließlich diejenigen mit den meisten Fachkenntnissen, wenn es um den Fehler geht. Sie sollten bei der Erarbeitung der Abhilfemaßnahmen stark eingebunden werden.
Wie ermögliche ich eine „gerechte Kultur“?
- Regen Sie zum Lernen an, indem Sie Postmortem-Analysen ohne Schuldzuweisungen zu Ausfällen und Unfällen durchführen.
- Erinnern Sie sich daran, dass es das Ziel ist, zu verstehen, wie ein Unfall passieren konnte, um sich besser dagegen zu wappnen, dass er in Zukunft passiert.
- Erfassen Sie Details aus verschiedenen Perspektiven zu Fehlern, und bestrafen Sie niemanden für seine Fehler.
- Anstatt Techniker zu bestrafen, geben Sie ihnen die nötige Autorität, um die Sicherheit zu verbessern, indem Sie ihnen gestatten, detailliert Rechenschaft über ihren Beitrag zu Fehlern abzulegen.
- Ermöglichen und ermutigen Sie Personen, die Fehler machen, die Experten zu sein, die dem Rest der Organisation beibringen, wie die Fehler in Zukunft nicht mehr gemacht werden.
- Akzeptieren Sie, dass es immer einen Ermessensspielraum gibt, in dem Personen entscheiden können, zu handeln oder nicht zu handeln, und dass die Bewertung dieser Entscheidungen im Nachhinein erfolgt.
- Akzeptieren Sie, dass Einsichtsverzerrungen unsere Bewertung vergangener Ereignisse trüben können. Arbeiten Sie also hart daran, diese zu beseitigen.
- Akzeptieren Sie, dass der grundlegende Zuordnungsfehler auch schwer zu umgehen ist. Konzentrieren Sie sich also bei der Untersuchung von Unfällen auf die Umgebung und die Umstände, in denen Personen arbeiten.
- Stellen Sie sicher, dass der“passive“ Teil (z. B. Vorstände oder Führungskräfte) der Organisation versteht, wie Aufgaben tatsächlich ausgeführt werden. Vergleichen Sie dies mit der Art und Weise, wie diese Personen sich die Erledigung von Aufgaben vorstellen. Verwenden Sie dazu Gantt-Diagramme und Verfahren für den „aktiven“ Teil (z. B. Ingenieure und Techniker).
- Der aktive Teil muss der Organisation mitteilen, wo sich die Linie zwischen geeignetem und ungeeignetem Verhalten befindet. Das ist nichts, was sich der latente Teil von alleine ausdenken kann.
Fehler passieren. Um zu verstehen, wie Fehler entstehen, müssen wir zunächst unsere Reaktionen auf Fehler verstehen.