Procedure utili per apprendere dagli errori

Completato

Ora che si conoscono alcuni tranelli comuni che possono sabotare o almeno limitare il valore delle analisi successive agli eventi imprevisti, la domanda logica successiva è "cosa si deve fare invece?"

In questa unità verranno illustrate quattro procedure utili che consentono di migliorare il processo di analisi successiva agli eventi imprevisti.

Procedura 1: Eseguire un'analisi successiva a eventi imprevisti con un facilitatore

È già chiaro che un'analisi successiva agli eventi imprevisti non è un documento o un report, ma è idealmente una conversazione; ne consegue, quindi, che un'"analisi a posteriori" dell'evento redatta da una sola persona, senza alcun confronto, non rappresenta un documento utile. Indipendentemente dalle conoscenze o dalle informazioni sull'evento imprevisto note a quella persona, non si imparerà molto se tutte le considerazioni provengono da un unico punto di vista.

La prima cosa da fare è riunire tutte le persone coinvolte nell'evento imprevisto. Durante la riunione, è spesso utile la presenza di un facilitatore che guidi la discussione. Idealmente, il facilitatore deve essere una persona "neutrale" che non ha partecipato effettivamente all'incidente. Si apprenderanno più informazioni se il facilitatore non ha preconcetti o un'esperienza personale dell'evento.

La riunione verrà strutturata in base al team, alla pianificazione e alla natura dell'evento imprevisto, tenendo però presenti le seguenti linee guida di base:

  • Riunioni, non maratone: Le riunioni non devono essere lunghe. In generale, l'effettiva e completa concentrazione e partecipazione della maggior parte delle persone va dai 60 ai 90 minuti al massimo ed è quindi consigliabile limitare la riunione a un massimo di un'ora e mezza.
  • Preparazione pre-riunione: Per sfruttare al meglio il tempo dedicato alla riunione, potrebbe essere utile per il facilitatore preparasi facendo singole interviste ad alcuni membri del team che ha affrontato l'incidente, per avere una panoramica dell'incidente e capire quali argomenti trattare durante la riunione. Le singole interviste possono essere illustrate al gruppo in caso di problemi personali tra i partecipanti o presenza di personalità che potrebbero ostacolare la riunione (o se alcune persone, per un qualsiasi motivo, non si sentono a loro agio a parlare con tutti i componenti).
  • Non obbligatorio per ogni incidente: Si tratta di un processo di apprendimento e si sta "imparando a imparare", quindi è meglio iniziare dalle cose semplici. Non è necessario farlo per ogni incidente. Si può scegliere. È possibile iniziare con eventi imprevisti meno rilevanti o facendo una riunione di revisione una volta al mese.

La riunione di analisi successiva agli eventi imprevisti è un'opportunità per capire cosa non ha funzionato, cosa ha funzionato e come gestire gli errori al meglio in futuro. L'obiettivo finale è quello di migliorare l'affidabilità.

Procedura 2: Fare domande migliori

Com'è noto, le parole sono importanti e, nell'analisi successiva a eventi imprevisti, questo è vero in particolare per quanto riguarda le domande. Porre domande obiettive di solito porta ad avere risposte più utili.

In particolare, è preferibile focalizzarsi sul "come" o sul "cosa" invece del "perché".

Quando alle persone viene chiesto di spiegare "perché" hanno fatto qualcosa o "perché" si è verificato un evento, esse tendono ad assumere un atteggiamento difensivo. La parola "perché" all'inizio di una domanda spesso viene percepita come un giudizio, una critica o un'accusa. Porta le persone a giustificare le proprie azioni, ma non sempre si conosce il motivo per cui si compie un'azione o il perché si è verificato un evento come risultato delle proprie azioni. Può anche condurle direttamente alla causa di un problema o alle conclusioni, ignorando molte informazioni che potrebbero essere interessanti. Ad esempio, se si chiede "perché il sistema non funziona?" la risposta potrebbe essere "Perché il disco è pieno". Questo ignora domande importanti come "come ti sei accorto che si è verificato un problema con il disco?" o anche "qual era la prima cosa che hai verificato sul sistema che ti ha spinto a controllarlo?"

Ciò non significa che non è possibile esplorare i fattori che contribuiscono per l'incidente o il ragionamento che una persona ha fatto per decidere come rispondere, significa semplicemente prestare attenzione a come si pongono queste domande:

Non chiedere "Perché hai fatto questa cosa?"

Piuttosto, chiedi "Quali fattori ti hanno portato a fare questa modifica?"

Non chiedere "Perché il problema non è stato risolto con il valore canary?"

Piuttosto, chiedi "Di solito il valore canary è utile per questo tipo di problema?Quanto?"

Tenere presente che l'obiettivo della revisione post-evento imprevisto è apprendere. Ogni partecipante all'incidente avrà probabilmente una visione leggermente diversa degli eventi. Si apprenderanno più informazioni se si fanno domande che consentono di esporre più punti di vista e interpretazioni.

Se si chiede come "normalmente", si lavora si apprenderanno le stesse informazioni di quando si chiede di un incidente specifico.

Per altre informazioni su come porre domande migliori, consultare questa risorsa:

Guida al debriefing per il facilitatore di Etsy

Procedura 3: Analizzare le operazioni eseguite correttamente

Quando si pensa ad apprendere dagli errori, spesso non si considera che anche nel caso di un'importante interruzione o di un incidente, oltre agli errori ci sono anche operazioni che sono state eseguite correttamente. Lontano dalla comune considerazione degli eventi imprevisti come situazioni uniche o prodotti di condizioni estreme, nei sistemi più complessi gli errori si verificano spesso per gli stessi motivi per cui le operazioni hanno esito positivo.

L'uomo, per natura, tende a concentrarsi sulle domande che riguardano il lato negativo dell'equazione. Anche l'analisi dei motivi per cui le operazioni riescono, tuttavia, consente di ottenere informazioni dettagliate che altrimenti non potrebbero essere recuperate.

Non bisogna chiedere solo come è successa l'interruzione, ma anche come si è recuperato.

È interessante sapere quali informazioni, strumenti, competenze e figure hanno contribuito al lavoro di ripristino. Si tratta di aspetti che potrebbero essere riprodotti, quindi di informazioni utili per la pianificazione delle procedure da seguire in futuro.

In questo contesto, è necessario chiedersi in che modo le persone hanno sviluppato le proprie competenze e su quali basi sono state prese determinate decisioni. C'è stato un momento in cui una persona ha condiviso informazioni che hanno contribuito a risolvere i problemi in corso? Come sapeva cosa fare? Da dove provengono queste informazioni?

È necessario cercare di individuare schemi e modelli. Infine, nel processo di riconoscimento delle operazioni riuscite, chiedere "Cosa sai ora di nuovo rispetto a prima?" Se dall'incidente, dalla relativa risposta e dai processi di analisi si sono apprese nuove informazioni, significa che qualcosa ha funzionato.

Questo ci riporta a un punto precedente: dobbiamo capire come migliorare la capacità di risposta, nella stessa misura in cui dobbiamo prevenire le interruzioni.

Procedura 4: Mantenere le riunioni di analisi e pianificazione separate

Dopo aver risolto l'incidente nell'immediato, in genere si tende a discutere degli elementi di ripristino e della mitigazione futura, ed è giusto farlo, ma questi argomenti non dovrebbero essere discussi durante la riunione di analisi successiva agli eventi imprevisti. La riunione di analisi successiva agli eventi imprevisti ha uno scopo ben preciso e discutere degli elementi di ripristino in questa sede distrae da tale scopo.

È consigliabile discutere gli elementi di ripristino e i problemi di pianificazione in un'altra sede, uno o due giorni dopo la revisione post-evento imprevisto, con un gruppo di persone ridotto.

Questa operazione può essere utile in due modi:

  • Facilita l'analisi successiva degli eventi imprevisti. È più facile evitare di saltare alle conclusioni se non ci si concentra su come risolvere il problema.
  • Far passare un giorno o due consente di identificare gli elementi di ripristino più "efficienti in termini di sforzo": sforzo minimo per un impatto massimo. Il subconscio può essere d'aiuto... basta dargli tempo.

Verificare le conoscenze

1.

Quale procedura è utile per condurre una riunione di revisione post-evento imprevisto?

2.

Quale domanda potrebbe distrarre dalle informazioni importanti in una revisione post-evento imprevisto?