Elementi fondamentali della risposta agli eventi imprevisti

Completato

Oggi le organizzazioni traggono vantaggio dall'accessibilità, dall'efficienza e dalla praticità del cloud, ma devono far fronte a molte problematiche mentre intraprendono un percorso di trasformazione digitale che implica lo spostamento di parti del business in servizi cloud.

Alcune delle problematiche comuni che potrebbe essere necessario affrontare nell'organizzazione includono:

  • Aumento del numero di interruzioni del servizio
  • Assenza di un metodo efficace di tracciamento e risposta agli eventi imprevisti (tutti gli interventi sono ad hoc o reattivi)
  • Tempi di risoluzione inaccettabili
  • Tempi di risoluzione che non migliorano o peggiorano
  • Difficoltà a reperire informazioni e stato
  • Ricorrenza degli stessi problemi ed errori

Per superare tali problematiche, è necessario un piano ben definito di risposta agli eventi imprevisti basato su fondamenta solide.

Elementi fondamentali e pilastri

Lo scopo delle fondamenta è sostenere e consolidare la struttura al di sopra. In un modulo introduttivo distinto di questo percorso di apprendimento è stata discussa l'idea che le attività legate all'affidabilità si basino sul livello fondamentale del monitoraggio e che la risposta agli eventi imprevisti si collochi nel livello immediatamente superiore della gerarchia.

Anche la risposta agli eventi imprevisti prevede elementi fondamentali. Un piano valido di risposta agli eventi imprevisti è supportato da tre pilastri:

  • Gruppi di persone dedicate
  • ruoli
  • Rotazioni

In questa unità, verrà descritto cosa sono questi pilastri e quale ruolo svolgono nella definizione di una strategia di risposta agli eventi imprevisti che procede lungo il percorso verso il raggiungimento degli obiettivi di affidabilità.

Gruppi di persone dedicate

È essenziale definire un piano valido, ma risulta inutile senza le persone che lo mettano in pratica. Pertanto, il punto di partenza migliore consiste nel determinare chi dovrà rispondere ai problemi e come comunicare che è necessaria una risposta.

Per risolvere questo problema, è consigliabile definire un gruppo di persone dedicate, che vengono assegnate al team in servizio. Questo team dovrà essere composto da più tecnici. I membri del team dovranno avere le conoscenze e le competenze necessarie per affrontare i tipi di problemi che possono verificarsi nell'ambiente e dovranno avere le qualifiche per rispondere agli eventi imprevisti.

Un elenco di nomi, però, non è sufficiente. È necessario creare una struttura per definire chi è di servizio in un determinato momento e quali interventi può intraprendere. Per questo scopo servono i ruoli.

ruoli

I ruoli introducono ordine in quella che altrimenti sarebbe una risposta caotica o nel migliore dei casi ad hoc. A questo scopo si definiscono le specifiche funzioni che ogni membro dovrà assumere in una determinata situazione e la posizione di ognuno nella "catena di comando". I ruoli possono variare in base all'organizzazione o anche in base al tipo di evento imprevisto, ma in generale in un team di risposta agli incidenti ben organizzato dovranno essere presenti i ruoli seguenti:

  • Prima persona che risponde: Si tratta della "persona di riferimento" che in genere si trova per prima sulla scena, ossia il primo tecnico in servizio che viene chiamato quando si verifica un evento imprevisto.
  • Seconda persona che risponde: Si tratta di qualcuno che funge da backup e può intervenire nel caso la prima persona non sia disponibile o se occorre un secondo paio di occhi.
  • Esperti in materia: Si tratta di persone con una conoscenza approfondita di un particolare aspetto delle operazioni. Vengono coinvolte se la prima o la seconda persona che risponde ha l'esigenza di inoltrare il problema a qualcuno con una maggiore esperienza. Non sono sempre in servizio, ma sono disponibili quando le loro competenze specializzate si rendono necessarie. È consigliabile mantenere un elenco di esperti in vari campi, ad esempio database, front-end, infrastruttura di rete, app Web, cybersecurity e così via.
  • Responsabile degli eventi imprevisti: Si tratta di un ruolo importante nel caso di eventi imprevisti su larga scala o di interruzioni che interessano molti componenti diversi e/o richiedono il coordinamento tra molti team e sistemi diversi. Il responsabile degli eventi imprevisti è la persona che coordina gran parte delle conversazioni e delle iniziative riguardanti le attività di risposta e correzione. Questa persona tiene d'occhio il "quadro generale" e controlla quali azioni vengono intraprese e da chi. Questo ruolo è importante per fare in modo che i tecnici rimangano concentrati e si impegnino a eseguire i loro interventi di correzione senza ostacolare o pregiudicare il lavoro di altri.
  • Trascrittore: Il ruolo di trascrittore consiste nel documentare la conversazione riguardo all'evento imprevisto nel modo più dettagliato possibile. I team usano in genere ponti telefonici, teleconferenze o videochat per le comunicazioni collettive e per provare a capire cosa sta succedendo, generando una notevole quantità di conversazioni. Tuttavia, è difficile esaminare e capire in dettaglio quello che i tecnici dicono e fanno, a meno che le conversazioni non vengano trascritte. Di conseguenza, un trascrittore è la persona che aiuta a documentare il più possibile i contenuti che verranno rivisti in seguito. Il trascrittore acquisisce tutti i dati possibili, non solo sulle attività svolte dai membri del team ma anche su quello che dicono, sulle loro percezioni e sull'esperienza in generale.
  • Coordinatore delle comunicazioni: Questo ruolo si può paragonare a un "responsabile delle pubbliche relazioni" per quanto riguarda gli eventi imprevisti. Il coordinatore delle comunicazioni collabora con il responsabile degli eventi imprevisti per condividere le informazioni pertinenti con le persone non direttamente coinvolte nella risoluzione dei problemi. Queste persone possono includere i clienti, i team di vendita e marketing, gli addetti al supporto clienti o qualsiasi altro stakeholder interno o esterno all'organizzazione che deve essere messo al corrente del problema in corso e dello stato di avanzamento delle misure di risposta e correzione.

Rotazioni

A questo punto si ha a disposizione un gruppo di persone dedicate del team di risposta e sono stati assegnati i ruoli appropriati. L'ultimo passaggio consiste nel creare una rotazione, ossia una pianificazione per assegnare i turni alle persone in servizio.

Esistono molti modi diversi per stabilire i turni. La pianificazione dei turni può essere un processo strategico complesso. I turni non devono essere assegnati in modo casuale; è consigliabile valutare con attenzione la pianificazione perché sia quanto più efficace possibile, anche tenendo conto delle esigenze dei membri del team.

I metodi di pianificazione dei turni includono:

  • 24 ore su 24, 7 giorni su 7: Si tratta di una rotazione per cui i membri del team sono in servizio diversi giorni di fila. Si tratta di un modo semplice per allocare la copertura dei turni, ma bisogna prestare attenzione a limitare la durata. Le rotazioni di turni che durano più di tre o quattro giorni possono essere deleterie per la salute generale del personale tecnico, riducendo di conseguenza l'affidabilità dell'intero sistema.
  • Seguire i turni solari: In questo modello i tecnici pianificano i loro turni in servizio solo durante i normali orari di lavoro e quindi a fine giornata cedono le loro responsabilità a un altro collega in una zona con un fuso orario diverso.

Questi sono solo alcuni esempi dei modi in cui è possibile assegnare turni. Il punto importante è dividere i turni nel modo ottimale per i membri del team di risposta. Esistono diversi modi per personalizzare i turni, specialmente per i fine settimana in cui i tecnici necessitano di una maggiore flessibilità. I tecnici dovranno essere in grado di trasferire facilmente il ruolo a qualcuno quando si verificano conflitti non legati al lavoro.

Verificare le conoscenze

1.

Quali sono i pilastri della risposta agli eventi imprevisti?

2.

Qual è la funzione del ruolo di trascrittore nell'ambito della risposta agli eventi imprevisti?

3.

Sono necessari tutti i ruoli indicati in questa unità per fornire una risposta efficace agli eventi imprevisti?