Elenco di controllo per la revisione della progettazione per l'eccellenza operativa
Questo elenco di controllo presenta un set di raccomandazioni che consentono di creare una cultura di eccellenza operativa. Iniziare con un approccio DevOps per integrare le specializzazioni di più discipline. Questo approccio crea una rigorosa pratica di progettazione e sviluppo. Questo approccio porta a distribuzioni ripetibili, affidabili e sicure dell'infrastruttura e del codice.
Classificare in ordine di priorità l'intervento umano in aree che ne traggono vantaggio e incorporare l'automazione in altre aree. L'osservabilità supporta l'eccellenza operativa monitorando eventi relativi alla salute e convalidando la progettazione e l'implementazione attuali del carico di lavoro, al fine di informare lo sviluppo futuro del prodotto.
Se non si considerano compromessi e raccomandazioni per l'eccellenza operativa, il carico di lavoro potrebbe essere a rischio. Considerare attentamente i punti trattati nell'elenco di controllo seguente per infondere fiducia nel successo della progettazione.
Lista di controllo
Codice | Raccomandazione | |
---|---|---|
☐ | OE:01 | Definire le procedure standard per sviluppare e gestire il carico di lavoro. Promuovere una cultura senza colpa che enfatizza l'apprendimento continuo e assegna priorità al miglioramento continuo e all'ottimizzazione. |
☐ | OE:02 | Formalizzare il modo in cui si esegue la routine, in base alle esigenze e le attività operative di emergenza. Aumentare la coerenza e la prevedibilità adottando procedure e approcci comprovati del settore. |
☐ | OE:03 | Formalizzare i processi di ideazione e pianificazione del software. Attingere agli standard di settore e organizzativi stabiliti per la comunicazione dei team, la documentazione sui requisiti e sulla progettazione, e i processi di sviluppo software. |
☐ |
OE:04 OE:04 OE:04 |
Migliorare lo sviluppo software e la garanzia di qualità implementando le procedure standard del settore. Garantire definizioni di ruolo chiare e processi coerenti standardizzando strumenti, controllo del codice sorgente, modelli di progettazione, documentazione e guide di stile. |
☐ | OE:05 | Usare un approccio IaC (Infrastructure as Code) standardizzato per preparare risorse e configurazioni. Usare IaC per garantire stili coerenti, modularizzazione e controllo della qualità. Preferire approcci dichiarativi rispetto a imperativi quando sono pratici. |
☐ | OE:06 | Creare una supply chain del carico di lavoro che determina le modifiche tramite pipeline automatizzate prevedibili. Assicurarsi che queste pipeline testino e promuovano le modifiche in tutti gli ambienti e soglie di qualità. Integrare test completi. |
☐ |
OE:07 OE:07 |
Progettare e implementare un sistema di monitoraggio per acquisire ed esporre dati di telemetria, metriche e log dall'infrastruttura e dal codice. Usare questi dati per convalidare le scelte di progettazione e guidare le future decisioni di progettazione e business. |
☐ | OE:08 | Stabilire una pratica efficace per le operazioni di emergenza. Creare un piano di risposta agli eventi imprevisti che documenta chiaramente ruoli, responsabilità e tutti i processi e le procedure di risposta di emergenza. Acquisire informazioni tramite postmortems e report sugli eventi imprevisti per migliorare continuamente il piano e il carico di lavoro. |
☐ | OE:09 | Automatizzare le attività ripetitive, procedurali e fornire un ritorno chiaro sugli investimenti. Preferisce gli strumenti di automazione off-the-shelf rispetto a soluzioni personalizzate. Applicare i pilastri di Well-Architected Framework alla progettazione e all'implementazione di tutte le attività di automazione. |
☐ | OE:10 | Ideare e implementare l'automazione fin dall'inizio per attività come la gestione del ciclo di vita, l'avvio iniziale e la governance. Evitare di implementare l'automazione in un secondo momento. Semplificare la progettazione adottando la funzionalità di automazione nativa della piattaforma. |
☐ | OE:11 | Definire chiaramente le procedure di distribuzione sicure del carico di lavoro. Concentrarsi su piccoli rilasci incrementali con controlli di qualità. Usare i modelli di distribuzione moderni e l'esposizione progressiva per gestire i rischi. Pianificare distribuzioni di routine e di emergenza. |
☐ | OE:12 | Implementare una strategia di mitigazione degli errori di distribuzione per gestire problemi imprevisti durante l'implementazione. Usare approcci come il rollback, la disabilitazione delle funzionalità o le funzionalità native del modello di distribuzione per il ripristino rapido. |
Passaggi successivi
È consigliabile esaminare i compromessi per l'eccellenza operativa per esplorare altri concetti.