Freigeben über


Prüfliste zur Designüberprüfung für Operational Excellence

Diese Checkliste enthält eine Reihe von Empfehlungen, mit denen Sie eine Kultur der betrieblichen Exzellenz aufbauen können. Beginnen Sie mit einem DevOps-Ansatz, um Spezialisierungen aus mehreren Disziplinen zu integrieren. Dieser Ansatz schafft eine strenge Entwurfs- und Entwicklungspraxis. Dieser Ansatz führt zu wiederholbaren, zuverlässigen und sicheren Bereitstellungen von Infrastruktur und Code.

Priorisieren Sie menschliche Interventionen in Bereichen, die davon profitieren, und integrieren Sie Automatisierung in andere Bereiche. Observability dient der betrieblichen Exzellenz durch Überwachung von Gesundheitsereignissen und zur Überprüfung des aktuellen Workloaddesigns und der Implementierung, um die zukünftige Produktentwicklung zu informieren.

Wenn Sie keine Kompromisse und Empfehlungen für operative Exzellenz in Betracht ziehen, ist Ihre Arbeitsauslastung möglicherweise gefährdet. Berücksichtigen Sie sorgfältig die punkte, die in der folgenden Checkliste behandelt werden, um das Vertrauen in den Erfolg Ihres Designs zu wecken.

Prüfliste

  Code Empfehlung
OE:01 Definieren Sie Ihre Standardpraktiken, um Ihre Workload zu entwickeln und zu betreiben. Fördern Sie eine schuldlose Kultur, die kontinuierliches Lernen betont und kontinuierliche Verbesserung und Optimierung priorisiert.
OE:02 Formalisieren Sie die Art und Weise, wie Sie Routine- und Notfallbetriebsaufgaben nach Bedarf ausführen. Erhöhen Sie Konsistenz und Vorhersagbarkeit, indem Sie bewährte Praktiken und Ansätze einführen.
OE:03 Formalisieren Sie Softwareidetions- und Planungsprozesse. Greifen Sie auf etablierte Branchen- und Organisationsstandards für Teamkommunikation, Anforderungs- und Entwurfsdokumentation sowie Softwareentwicklungsprozesse zurück.
OE:04
OE:04
OE:04
Verbessern der Softwareentwicklung und Qualitätssicherung durch Implementierung von Branchenstandardpraktiken. Stellen Sie klare Rollendefinitionen und konsistente Prozesse sicher, indem Sie Tools, Quellcodeverwaltung, Entwurfsmuster, Dokumentation und Stilführungslinien standardisieren.
OE:05 Verwenden Sie eine standardisierte Infrastruktur als Codeansatz (IaC), um Ressourcen und Konfigurationen vorzubereiten. Verwenden Sie IaC, um konsistente Stile, Modularisierung und Qualitätssicherung sicherzustellen. Bevorzugen Sie deklarative Ansätze über imperative, wenn möglich.
OE:06 Erstellen Sie eine Workload-Lieferkette, die Änderungen durch vorhersagbare, automatisierte Pipelines steuert. Stellen Sie sicher, dass diese Pipelines Änderungen in allen Umgebungen und Quality Gates testen und fördern. Integrieren Sie umfassende Tests.
OE:07
OE:07
Entwerfen und Implementieren eines Überwachungssystems, um Telemetrie, Metriken und Protokolle aus Ihrer Infrastruktur und Ihrem Code zu erfassen und verfügbar zu machen. Verwenden Sie diese Daten, um Designentscheidungen zu überprüfen und zukünftige Design- und Geschäftsentscheidungen zu leiten.
OE:08 Einrichten einer robusten Notfalloperationspraxis. Erstellen Sie einen Plan für die Reaktion auf Vorfälle, der klar Rollen, Zuständigkeiten und alle Prozesse und Verfahren für die Notfallreaktion dokumentiert. Erfassen Sie Erkenntnisse durch Postmortems und Vorfallberichte, um den Plan und die Arbeitsauslastung kontinuierlich zu verbessern.
OE:09 Automatisieren Sie Aufgaben, die repetitiv, prozedural sind und einen klaren Return on Investment bieten. Bevorzugen Sie standardbasierte Automatisierungstools gegenüber benutzerdefinierten Lösungen. Wenden Sie die Well-Architected Framework-Säulen auf den Entwurf und die Implementierung aller Automatisierungsbemühungen an.
OE:10 Entwerfen und implementieren Sie die Automatisierung im Vorfeld für Aufgaben wie Lifecycle Management, Bootstrapping und Governance. Vermeiden Sie später die Nachrüstung der Automatisierung. Vereinfachen Sie Ihr Design, indem Sie plattformeigene Automatisierungsfunktionen einführen.
OE:11 Definieren Sie klar und deutlich die Praktiken für die sichere Bereitstellung Ihrer Workload. Konzentrieren Sie sich auf kleine, inkrementelle Freigaben mit Qualitätsschranken. Verwenden Sie moderne Bereitstellungsmuster und progressive Exposition, um Risiken zu verwalten. Planen Sie sowohl Routine- als auch Notfallbereitstellungen.
OE:12 Implementieren sie eine Strategie zur Risikominderung von Bereitstellungsfehlern, um unerwartete Probleme während des Rollouts zu behandeln. Verwenden Sie Ansätze wie Rollback, Feature-Deaktivierung oder die systemeigenen Funktionen Ihres Bereitstellungsmusters für schnelle Wiederherstellung.

Nächste Schritte

Wir empfehlen Ihnen, die Operational Excellence-Kompromisse zu überprüfen, um andere Konzepte zu erkunden.