Zagadnienia dotyczące odporności strategii chmury
Odporność to zdolność infrastruktury do utrzymania funkcjonalności i dostępności pomimo zakłóceń lub awarii. Jest to kamień węgielny każdej udanej strategii wdrażania chmury. Zaprojektuj infrastrukturę chmury z myślą o odporności, aby zminimalizować wpływ zakłóceń. Dzięki temu można zachować ciągłość i niezawodność w operacjach biznesowych.
Należy wziąć pod uwagę, że bardziej ściśle zintegrowana twoja firma jest z twoją technologią, tym ważniejsze jest odporność tej technologii.
Jeśli system obsługuje kluczowy proces lub ma kluczowe znaczenie dla operacji biznesowych, wszelkie przestoje mogą prowadzić do znacznych strat finansowych, opróżniania zasobów, a nawet całkowitego zatrzymania działań biznesowych.
Planowanie nieoczekiwanego planu
W nowoczesnym krajobrazie, w którym przestój może prowadzić do znacznych strat finansowych i uszkodzenia reputacji, odporność jest koniecznością dla wielu organizacji. Niezależnie od tego, czy jest to spowodowane klęskami żywiołowymi, cyberatakami, czy awariami systemu, zakłócenia mogą wystąpić nieoczekiwanie w dowolnym momencie.
Odporność polega na zapewnieniu, że infrastruktura i aplikacje w chmurze są wystarczająco niezawodne, aby sprostać tym wyzwaniom, zminimalizować przestoje i zachować integralność usług i danych.
Zazwyczaj nie wszystkie systemy w firmie wymagają tego samego poziomu odporności. Możesz rozważyć umożliwienie elastyczności na poziomach odporności w firmie, dzięki czemu możesz skupić się na inwestycjach w odporność, gdzie jest to najważniejsze.
Odporność umożliwia również organizacji utrzymanie ciągłości działania, spełnienie wymagań prawnych i zwiększenie zaufania klientów, pomagając zapewnić, że krytyczne aplikacje i usługi pozostaną dostępne, gdy wystąpi nieoczekiwana sytuacja.
Omówienie modelu wspólnej odpowiedzialności
Odporność to wspólna odpowiedzialność między dostawcą usług w chmurze a jej klientami.
Model wspólnej odpowiedzialności definiuje podział obowiązków i ustanawia granice dotyczące tego, czym zarządza dostawca, podobnie jak podstawowa infrastruktura chmury, oraz za to, za co odpowiada klient, na przykład zabezpieczenia i konfiguracja swoich aplikacji i danych.
Dokumentowanie i zrozumienie wspólnej odpowiedzialności ma kluczowe znaczenie w strategii wdrażania chmury, ponieważ zapewnia zrozumienie roli w utrzymaniu bezpieczeństwa, zgodności i niezawodności. Dzięki włączeniu modelu wspólnej odpowiedzialności do strategii możesz aktywnie rozwiązywać potencjalne zagrożenia, zapewnić odpowiedni nadzór i utworzyć bardziej niezawodne środowisko chmury zgodne z celami organizacji i wymaganiami prawnymi.
Zapewnienie niezawodności systemu na platformie Azure jest wspólną odpowiedzialnością między klientem a dostawcą usług w chmurze. Firma Microsoft zarządza niezawodnością platformy w chmurze, podczas gdy klienci i partnerzy są odpowiedzialni za niezawodność swoich aplikacji w chmurze i wdrożeń infrastruktury.
Zwiększanie możliwości strategii wdrażania chmury
Zintegrowanie odporności ze strategią wdrażania chmury zapewnia kontrolę jakości jako przewagę konkurencyjną. Projektując architekturę z odpornością, możesz pomóc w zapewnieniu, że aplikacje i twoja firma działają w wielu sytuacjach, w tym w przypadku problemów ze sprzętem lub siecią, a nawet utraty centrum danych lub całego regionu chmury. Ten strategiczny nacisk pozwala na bardziej efektywne przydzielanie zasobów, lepszą wydajność operacyjną i lepsze zarządzanie ryzykiem.
Może również ułatwić elastyczne wdrażanie usług, umożliwiając organizacji szybkie dostosowanie się do wymagań rynkowych przy zachowaniu niezawodnych poziomów zabezpieczeń i zgodności.
Ostatecznie odporność jest istotnym składnikiem strategii wdrażania chmury, ponieważ napędza jakość i innowacje oraz wspiera długoterminowe cele biznesowe.
Przykłady scenariuszy odporności
Poniżej przedstawiono kilka przykładów znaczenia odporności w strategii wdrażania chmury mapowanych na określone typy scenariuszy ryzyka.
Scenariusz ryzyka | Wpływ na ryzyko | Przykład ograniczania odporności |
---|---|---|
Cyberataki | Wymuszanie okupu, rozproszona odmowa usługi (DDoS) lub nieautoryzowany dostęp. | Aby zmniejszyć wpływ, uwzględnij niezawodne środki zabezpieczeń, w tym odpowiedni proces tworzenia kopii zapasowych i odzyskiwania, w strategii i planie wdrażania. |
błędy systemu | Awarie sprzętu lub oprogramowania. | Projektowanie pod kątem szybkiego odzyskiwania i przywracania integralności danych. Zarządzaj przejściowymi błędami w swoich aplikacjach i zapewniaj nadmiarowość w infrastrukturze, takich jak wiele replik z automatycznym przełączaniem awaryjnym. |
problemy z konfiguracją | Błędy wdrażania lub błędy konfiguracji. | Traktuj zmiany konfiguracji tak jak zmiany w kodzie, z wykorzystaniem infrastruktury jako kodu (IaC). Użyj potoków ciągłej integracji/ciągłego wdrażania (CI/CD), wdrożeń kanarowych i mechanizmów wycofywania, aby zminimalizować wpływ wadliwych aktualizacji lub wdrożeń. |
wzrosty zapotrzebowania lub przeciążenie | Spadek wydajności podczas szczytowego użycia lub skoków ruchu. | Użyj elastycznej skalowalności, aby zapewnić automatyczne skalowanie systemów w celu obsługi zwiększonego zapotrzebowania bez przerw w działaniu usługi. |
błędy zgodności | Naruszenia standardów regulacyjnych. | Wdrażanie narzędzi zgodności, takich jak Microsoft Purview, i używanie usługi Azure Policy do wymuszania wymagań dotyczących zgodności. |
klęski żywiołowe | Awarie centrum danych spowodowane trzęsieniami ziemi, powodziami lub burzami. | Zaplanuj tryb failover, wysoką dostępność i odzyskiwanie po awarii, korzystając ze stref dostępności, wielu regionów lub nawet rozwiązań wielochmurowych. |
Zalecenia
Postępuj zgodnie z tymi zaleceniami, aby uwzględnić zagadnienia dotyczące odporności w strategii wdrażania chmury.
Wykonaj analizę wpływu na działalność biznesową (BIA): zdefiniuj krytyczność różnych systemów i aplikacji, aby ułatwić ustalanie priorytetów wysiłków związanych z zasobami i odzyskiwaniem. Wykonaj tę analizę iteracyjnie w całym wdrożeniu chmury.
przeprowadzić ocenę ryzyka: zidentyfikuj potencjalne zagrożenia i luki w zabezpieczeniach, które mogą wpłynąć na infrastrukturę chmury, i użyj ich do tworzenia strategii ograniczania ryzyka oraz informowania o planach odporności i niezawodności.
Ukończ analizę kosztów i korzyści: mapuj i dowiedz się, w jaki sposób inwestycje w wdrożenie chmury są zgodne z wymaganiami dotyczącymi ciągłości działania i umowami SLA.
Understand shared responsibility: Upewnij się, że zespół strategiczny zawiera szczegółowe informacje na temat wspólnego modelu odpowiedzialności w chmurze, w tym wpływu na niezawodność. Aby uzyskać więcej informacji, zobacz wymagania dotyczące niezawodności .
Omówienieniezawodności platformy Azure: skorzystaj z dokumentacji niezawodności platformy Azure , aby lepiej zrozumieć, jak działa niezawodność i odporność na platformie Azure.
Zrozumieć możliwości niezawodności usług platformy Azure: Zapoznaj się z przewodnikami dotyczącymi niezawodności usług platformy Azure , aby opracować strategię wdrażania dotyczącą możliwości niezawodności określonych usług platformy Azure.
Omówienie celów odzyskiwania: dowiedz się więcej na temat celów czasu odzyskiwania (RTO) i celów punktu odzyskiwania (RPO) w ramach strategii wdrażania chmury w celu zrozumienia limitów przestojów i utraty danych dla systemów.
Definiowanie realistycznych celów dotyczących niezawodności: ustaw realistyczne oczekiwania z wewnętrznymi uczestnikami projektu na temat niezawodności i użyj umów umownych, aby przekazać te oczekiwania klientom. Zobacz Zalecenia dotyczące platformy Azure Well-Architected Framework, aby zdefiniować cele niezawodności.