Udostępnij za pośrednictwem


Zagadnienia dotyczące odporności strategii chmury

Odporność to zdolność infrastruktury do utrzymania funkcjonalności i dostępności pomimo zakłóceń lub awarii. Jest to kamień węgielny każdej udanej strategii wdrażania chmury. Zaprojektuj infrastrukturę chmury z myślą o odporności, aby zminimalizować wpływ zakłóceń. Dzięki temu można zachować ciągłość i niezawodność w operacjach biznesowych.

Należy wziąć pod uwagę, że bardziej ściśle zintegrowana twoja firma jest z twoją technologią, tym ważniejsze jest odporność tej technologii.

Jeśli system obsługuje kluczowy proces lub ma kluczowe znaczenie dla operacji biznesowych, wszelkie przestoje mogą prowadzić do znacznych strat finansowych, opróżniania zasobów, a nawet całkowitego zatrzymania działań biznesowych.

Planowanie nieoczekiwanego planu

W nowoczesnym krajobrazie, w którym przestój może prowadzić do znacznych strat finansowych i uszkodzenia reputacji, odporność jest koniecznością dla wielu organizacji. Niezależnie od tego, czy jest to spowodowane klęskami żywiołowymi, cyberatakami, czy awariami systemu, zakłócenia mogą wystąpić nieoczekiwanie w dowolnym momencie.

Odporność polega na zapewnieniu, że infrastruktura i aplikacje w chmurze są wystarczająco niezawodne, aby sprostać tym wyzwaniom, zminimalizować przestoje i zachować integralność usług i danych.

Zazwyczaj nie wszystkie systemy w firmie wymagają tego samego poziomu odporności. Możesz rozważyć umożliwienie elastyczności na poziomach odporności w firmie, dzięki czemu możesz skupić się na inwestycjach w odporność, gdzie jest to najważniejsze.

Odporność umożliwia również organizacji utrzymanie ciągłości działania, spełnienie wymagań prawnych i zwiększenie zaufania klientów, pomagając zapewnić, że krytyczne aplikacje i usługi pozostaną dostępne, gdy wystąpi nieoczekiwana sytuacja.

Omówienie modelu wspólnej odpowiedzialności

Odporność to wspólna odpowiedzialność między dostawcą usług w chmurze a jej klientami.

Model wspólnej odpowiedzialności definiuje podział obowiązków i ustanawia granice dotyczące tego, czym zarządza dostawca, podobnie jak podstawowa infrastruktura chmury, oraz za to, za co odpowiada klient, na przykład zabezpieczenia i konfiguracja swoich aplikacji i danych.

Dokumentowanie i zrozumienie wspólnej odpowiedzialności ma kluczowe znaczenie w strategii wdrażania chmury, ponieważ zapewnia zrozumienie roli w utrzymaniu bezpieczeństwa, zgodności i niezawodności. Dzięki włączeniu modelu wspólnej odpowiedzialności do strategii możesz aktywnie rozwiązywać potencjalne zagrożenia, zapewnić odpowiedni nadzór i utworzyć bardziej niezawodne środowisko chmury zgodne z celami organizacji i wymaganiami prawnymi.

Zapewnienie niezawodności systemu na platformie Azure jest wspólną odpowiedzialnością między klientem a dostawcą usług w chmurze. Firma Microsoft zarządza niezawodnością platformy w chmurze, podczas gdy klienci i partnerzy są odpowiedzialni za niezawodność swoich aplikacji w chmurze i wdrożeń infrastruktury.

Diagram przedstawiający wspólną macierz odpowiedzialności na potrzeby odporności.

Zwiększanie możliwości strategii wdrażania chmury

Zintegrowanie odporności ze strategią wdrażania chmury zapewnia kontrolę jakości jako przewagę konkurencyjną. Projektując architekturę z odpornością, możesz pomóc w zapewnieniu, że aplikacje i twoja firma działają w wielu sytuacjach, w tym w przypadku problemów ze sprzętem lub siecią, a nawet utraty centrum danych lub całego regionu chmury. Ten strategiczny nacisk pozwala na bardziej efektywne przydzielanie zasobów, lepszą wydajność operacyjną i lepsze zarządzanie ryzykiem.

Może również ułatwić elastyczne wdrażanie usług, umożliwiając organizacji szybkie dostosowanie się do wymagań rynkowych przy zachowaniu niezawodnych poziomów zabezpieczeń i zgodności.

Ostatecznie odporność jest istotnym składnikiem strategii wdrażania chmury, ponieważ napędza jakość i innowacje oraz wspiera długoterminowe cele biznesowe.

Przykłady scenariuszy odporności

Poniżej przedstawiono kilka przykładów znaczenia odporności w strategii wdrażania chmury mapowanych na określone typy scenariuszy ryzyka.

Scenariusz ryzyka Wpływ na ryzyko Przykład ograniczania odporności
Cyberataki Wymuszanie okupu, rozproszona odmowa usługi (DDoS) lub nieautoryzowany dostęp. Aby zmniejszyć wpływ, uwzględnij niezawodne środki zabezpieczeń, w tym odpowiedni proces tworzenia kopii zapasowych i odzyskiwania, w strategii i planie wdrażania.
błędy systemu Awarie sprzętu lub oprogramowania. Projektowanie pod kątem szybkiego odzyskiwania i przywracania integralności danych. Zarządzaj przejściowymi błędami w swoich aplikacjach i zapewniaj nadmiarowość w infrastrukturze, takich jak wiele replik z automatycznym przełączaniem awaryjnym.
problemy z konfiguracją Błędy wdrażania lub błędy konfiguracji. Traktuj zmiany konfiguracji tak jak zmiany w kodzie, z wykorzystaniem infrastruktury jako kodu (IaC). Użyj potoków ciągłej integracji/ciągłego wdrażania (CI/CD), wdrożeń kanarowych i mechanizmów wycofywania, aby zminimalizować wpływ wadliwych aktualizacji lub wdrożeń.
wzrosty zapotrzebowania lub przeciążenie Spadek wydajności podczas szczytowego użycia lub skoków ruchu. Użyj elastycznej skalowalności, aby zapewnić automatyczne skalowanie systemów w celu obsługi zwiększonego zapotrzebowania bez przerw w działaniu usługi.
błędy zgodności Naruszenia standardów regulacyjnych. Wdrażanie narzędzi zgodności, takich jak Microsoft Purview, i używanie usługi Azure Policy do wymuszania wymagań dotyczących zgodności.
klęski żywiołowe Awarie centrum danych spowodowane trzęsieniami ziemi, powodziami lub burzami. Zaplanuj tryb failover, wysoką dostępność i odzyskiwanie po awarii, korzystając ze stref dostępności, wielu regionów lub nawet rozwiązań wielochmurowych.

Zalecenia

Postępuj zgodnie z tymi zaleceniami, aby uwzględnić zagadnienia dotyczące odporności w strategii wdrażania chmury.

  • Wykonaj analizę wpływu na działalność biznesową (BIA): zdefiniuj krytyczność różnych systemów i aplikacji, aby ułatwić ustalanie priorytetów wysiłków związanych z zasobami i odzyskiwaniem. Wykonaj tę analizę iteracyjnie w całym wdrożeniu chmury.

  • przeprowadzić ocenę ryzyka: zidentyfikuj potencjalne zagrożenia i luki w zabezpieczeniach, które mogą wpłynąć na infrastrukturę chmury, i użyj ich do tworzenia strategii ograniczania ryzyka oraz informowania o planach odporności i niezawodności.

  • Ukończ analizę kosztów i korzyści: mapuj i dowiedz się, w jaki sposób inwestycje w wdrożenie chmury są zgodne z wymaganiami dotyczącymi ciągłości działania i umowami SLA.

  • Understand shared responsibility: Upewnij się, że zespół strategiczny zawiera szczegółowe informacje na temat wspólnego modelu odpowiedzialności w chmurze, w tym wpływu na niezawodność. Aby uzyskać więcej informacji, zobacz wymagania dotyczące niezawodności .

  • Omówienieniezawodności platformy Azure: skorzystaj z dokumentacji niezawodności platformy Azure , aby lepiej zrozumieć, jak działa niezawodność i odporność na platformie Azure.

  • Zrozumieć możliwości niezawodności usług platformy Azure: Zapoznaj się z przewodnikami dotyczącymi niezawodności usług platformy Azure , aby opracować strategię wdrażania dotyczącą możliwości niezawodności określonych usług platformy Azure.

  • Omówienie celów odzyskiwania: dowiedz się więcej na temat celów czasu odzyskiwania (RTO) i celów punktu odzyskiwania (RPO) w ramach strategii wdrażania chmury w celu zrozumienia limitów przestojów i utraty danych dla systemów.

  • Definiowanie realistycznych celów dotyczących niezawodności: ustaw realistyczne oczekiwania z wewnętrznymi uczestnikami projektu na temat niezawodności i użyj umów umownych, aby przekazać te oczekiwania klientom. Zobacz Zalecenia dotyczące platformy Azure Well-Architected Framework, aby zdefiniować cele niezawodności.

Następny krok