Lista kontrolna zaleceń dotyczących niezawodności
Ta lista kontrolna przedstawia zestaw zaleceń dotyczących oceny strategii niezawodności, odporności i odzyskiwania po awarii w architekturze projektu. Aby zapewnić niezawodność, zidentyfikuj najlepszy projekt infrastruktury i aplikacji do obciążenia. Podejmuj te decyzje w zależności od wymagań biznesowych mapowanych na metryki docelowe dostępności i odzyskiwania danych.
Aby wdrożyć wiarygodne projektowanie, należy dokładnie rozważyć punkty podjęcia decyzji w projekcie i mieć świadomość, w jaki sposób te decyzje mają wpływ na obciążenie. Ta lista kontrolna i przewodniki, które są z nią dostępne, oferują zasoby pomocne w podejmowaniu tych decyzji. Niezawodność obciążenia należy uwzględniać na każdym etapie projektowania, projektowania i cyklu życia operacji.
Lista kontrolna
W tym celu należy skupić się na niezawodności, aby zapewnić, że projektowane obciążenie będzie odporne, z możliwością zarządzania i powtarzalne. Jeśli nie uwzględniasz rozwiązań niezawodności i nie uwzględniasz transakcji, projekt jest potencjalnie narażony na ryzyko. Rozważ wszystkie punkty, które zostały uwzględnione na liście kontrolnej, aby zbudować pewność w sukces systemu.
Kod | Rekomendacja | |
---|---|---|
☐ | RE:01 | Zaprojektuj obciążenie tak, aby było zgodne z celami biznesowymi i unikaj niepotrzebnej złożoności lub narzutu. Aby podejmować decyzje dotyczące projektu, które zapewniają żądane rezultaty, należy stosować praktyczny i zrównoważony sposób. Należy także ograniczyć projekt i potencjalne problemy, aby zmniejszyć brak wydajności i potencjalne problemy. |
☐ | RE:02 | Identyfikowanie i ocenianie przepływów użytkowników i systemów. Aby określić priorytety przepływów, należy użyć skali krytycznej opartej na wymaganiach biznesowych. |
☐ | RE:03 | Analiza trybu awarii (FMA) umożliwia identyfikowanie i ustalanie priorytetów potencjalnych awarii w składnikach rozwiązania. Wykonaj FMA w celu dokonania oceny ryzyka i efektu poszczególnych trybów niepowodzenia. Określ sposób odpowiedzi i odzyskiwania obciążenia. |
☐ | RE:04 | Zdefiniuj cele niezawodności i odzyskiwania dla składników, przepływów i całego rozwiązania. Zwizualizuj cele do negocjacji, uzyskaj i ustaw oczekiwania oraz ustaw działania mające na celu osiągnięcie idealnego stanu. Do tworzenia modelu kondycji można użyć zdefiniowanych wartości docelowych. Model kondycji definiuje stany, które są w dobrej kondycji, pogarszającej się kondycji i w złej kondycji. |
☐ | RE:05 RE:05 |
Zwiększ odporność obciążenia, implementując obsługę błędów i obsługę błędów przejściowych. Funkcje należy tworzyć w rozwiązaniu w celu obsługi awarii składników i błędów przejściowych. |
☐ | RE:06 | Testuj scenariusze odporności i dostępności, stosując zasady inżynierii chaosu w środowiskach testowych i produkcyjnych. Zastosowanie testowania gwarantuje, że strategie implementacji tego programu są skuteczne przez przeprowadzenie aktywnego testowania i symulowanego testowania obciążenia. |
☐ | RE:07 | Wdrażaj ustrukturyzowane, przetestowane i udokumentowane plany ciągłości działania i odzyskiwania po awarii (BCDR), które są zgodne z celami odzyskiwania. W planach muszą zostać także dodane wszystkie składniki i system jako całość. |
☐ | RE:08 | Mierz i publikuj wskaźniki kondycji rozwiązania. W sposób ciągły przechwytuj dane dotyczące czasu pracy i innych danych niezawodności, które są wykorzystywane w całym obciążeniu, a także z poszczególnych składników i przepływów kluczowych. |