클라우드 전략에 대한 복원력 고려 사항

아티클
02/03/2025

복원력은 인프라가 중단 또는 실패에도 불구하고 기능과 가용성을 유지하는 기능입니다. 이는 성공적인 클라우드 채택 전략의 초석입니다. 중단의 영향을 최소화하기 위해 복원력을 염두에 두고 클라우드 인프라를 디자인합니다. 이렇게 하면 비즈니스 운영에서 연속성과 안정성을 유지할 수 있습니다.

비즈니스가 기술과 더 긴밀하게 통합될수록 해당 기술의 복원력이 더 중요합니다.

시스템이 주요 프로세스를 지원하거나 비즈니스 운영에 중요한 경우 가동 중지 시간이 발생하면 상당한 재정적 손실, 리소스 드레이닝 또는 비즈니스 활동이 완전히 중단될 수 있습니다.

예기치 않은 계획

가동 중지 시간이 상당한 재정적 손실과 평판 손상으로 이어질 수 있는 현대 환경에서 복원력은 많은 조직에 필수적입니다. 자연 재해, 사이버 공격 또는 시스템 오류로 인해 발생하는지 여부에 관계없이 중단은 언제든지 예기치 않게 발생할 수 있습니다.

복원력은 클라우드 인프라와 애플리케이션이 이러한 문제를 처리하고 가동 중지 시간을 최소화하며 서비스 및 데이터의 무결성을 유지할 수 있을 만큼 견고하도록 하는 것입니다.

일반적으로 비즈니스의 모든 시스템에 동일한 수준의 복원력이 필요한 것은 아닙니다. 가장 중요한 복원력 투자에 집중할 수 있도록 비즈니스 내의 복원력 수준에서 유연성을 허용하는 것이 좋습니다.

또한 복원력을 통해 조직은 예기치 않은 일이 발생할 때 중요한 애플리케이션 및 서비스를 계속 사용할 수 있도록 하여 비즈니스 연속성을 유지하고, 규정 요구 사항을 충족하며, 고객 신뢰를 향상시킬 수 있습니다.

공유 책임 모델 이해

복원력은 클라우드 공급자와 고객 간의 공동 책임입니다.

공유 책임 모델은 책임의 분할을 정의하고 핵심 클라우드 인프라와 같이 공급자가 관리하는 항목과 고객이 담당하는 책임(예: 애플리케이션 및 데이터의 보안 및 구성)에 대한 경계를 설정합니다.

공유 책임을 문서화하고 이해하는 것은 보안, 규정 준수 및 안정성 유지 관리에서 사용자의 역할을 이해할 수 있도록 하기 때문에 클라우드 채택 전략에서 매우 중요합니다. 공동 책임 모델을 전략에 통합하면 잠재적 위험을 사전에 해결하고, 적절한 거버넌스를 보장하며, 조직의 목표 및 규정 요구 사항에 부합하는 보다 강력한 클라우드 환경을 구축할 수 있습니다.

Azure에서 시스템 안정성을 보장하는 것은 고객과 클라우드 공급자 간의 공동 책임입니다. Microsoft는 클라우드 플랫폼 안정성을 관리하며, 고객과 파트너는 클라우드 애플리케이션 및 인프라 배포 안정성을담당합니다.

복원력에 대한 공유 책임 매트릭스를 보여 주는 다이어그램

클라우드 채택 전략 강화

복원력을 클라우드 채택 전략에 통합하면 품질 관리를 경쟁 우위로 사용할 수 있습니다. 복원력으로 아키텍처를 설계하면 하드웨어 또는 네트워킹 문제, 데이터 센터 또는 전체 클라우드 지역 손실을 비롯한 다양한 상황에서 애플리케이션과 비즈니스가 작동하도록 할 수 있습니다. 이러한 전략적 초점을 통해 보다 효과적인 리소스 할당, 향상된 운영 효율성 및 더 나은 위험 관리를 수행할 수 있습니다.

또한 강력한 보안 및 규정 준수 상태를 유지하면서 조직이 시장 요구에 빠르게 적응할 수 있도록 하여 서비스의 민첩한 배포를 용이하게 할 수 있습니다.

궁극적으로 복원력은 품질과 혁신을 주도하고 장기적인 비즈니스 목표를 지원하기 때문에 클라우드 채택 전략의 필수 구성 요소입니다.

복원력 시나리오 예제

다음은 특정 유형의 위험 시나리오에 매핑된 클라우드 채택 전략에서 복원력의 중요성에 대한 몇 가지 예입니다.

위험 시나리오	위험 영향	복원력 완화 예제
사이버 공격	랜섬웨어, DDoS(분산 서비스 거부) 또는 무단 액세스.	영향을 줄이려면 채택 전략 및 계획에 적절한 백업 및 복구 프로세스를 포함한 강력한 보안 조치를 포함합니다.
시스템 오류	하드웨어 또는 소프트웨어 오작동.	빠른 복구 및 데이터 무결성 복원을 위한 디자인입니다. 애플리케이션에서 일시적인 오류를 처리하고, 자동 장애 조치를 사용하는 여러 복제본 등과 같은 인프라 내에서 중복성을 구현하세요.
구성 문제	배포 오류 또는 잘못된 구성	IaC(인프라를 코드)로 사용하여 구성 변경 내용을 코드 변경으로 처리합니다. CI/CD(연속 통합/지속적인 배포) 파이프라인, 카나리아 배포 및 롤백 메커니즘을 사용하여 잘못된 업데이트 또는 배포의 영향을 최소화합니다.
수요 급증 또는 오버로드	사용량이 가장 많은 동안 성능이 저하되거나 트래픽이 급증합니다.	탄력적 확장성을 사용하여 시스템의 크기를 자동으로 조정하여 서비스 중단 없이 증가하는 수요를 처리하도록 합니다.
준수 실패	규정 표준 위반.	Microsoft Purview와 같은 규정 준수 도구를 채택하고 Azure Policy를 사용하여 규정 준수 요구 사항을 적용합니다.
자연 재해	지진, 홍수 또는 폭풍으로 인한 데이터 센터 가동 중단.	가용성 영역, 여러 지역 또는 다중 클라우드 접근 방식을 사용하여 장애 조치(failover), 고가용성 및 재해 복구를 계획합니다.

권장 사항

이러한 권장 사항에 따라 복원력 고려 사항을 클라우드 채택 전략에 알릴 수 있습니다.

BIA(비즈니스 영향 분석)수행: 리소스 및 복구 작업의 우선 순위를 지정하는 데 도움이 되는 다양한 시스템 및 애플리케이션의 중요도를 정의합니다. 클라우드 채택 전체에서 이 분석을 반복적으로 수행합니다.
위험 평가수행: 클라우드 인프라에 영향을 줄 수 있는 잠재적인 위협 및 취약성을 식별하고 이를 사용하여 완화 전략을 수립하고 복원력 및 안정성 계획을 알릴 수 있습니다.
비용 혜택 분석완료: 클라우드 채택에 대한 투자가 비즈니스 연속성 요구 사항 및 SLA와 어떻게 일치하는지 매핑하고 이해합니다.
공유 책임이해: 전략 팀에 안정성에 미치는 영향을 포함하여 클라우드의 공유 책임 모델에 대한 세부 정보가 포함되어 있는지 확인합니다. 자세한 내용은 안정성 요구 사항참조하세요.
Azure 안정성이해: Azure 안정성 설명서 사용하여 Azure에서 안정성 및 복원력이 작동하는 방식을 더 잘 이해할 수 있습니다.
Azure 서비스안정성 기능 이해: Azure 서비스 안정성 가이드 검토하여 특정 Azure 서비스의 안정성 기능에 대한 채택 전략을 알릴 수 있습니다.
복구 목표이해: 시스템의 가동 중지 시간 및 데이터 손실 제한을 이해하기 위한 클라우드 채택 전략의 일환으로 RTO(복구 시간 목표) 및 RPO(복구 지점 목표) 대해 알아봅니다.
현실적인 안정성 목표 정의: 안정성에 대한 내부 이해 관계자와 현실적인 기대치를 설정하고 계약 계약을 사용하여 이러한 기대치를 고객에게 전달합니다. 안정성 대상 정의하기 위한 Azure Well-Architected Framework권장 사항을 참조하세요.

다음 단계

보안 고려 사항

다음을 통해 공유