데이터 서비스 토폴로지
Contoso의 데이터 플랫폼에 대한 데이터 서비스 토폴로지의 개략적인 설명은 다음과 같습니다. 이 논리 다이어그램은 Contoso 데이터 에코시스템의 주요 기능을 간소화된 상위 수준 보기로 추상화합니다. 이 추상화된 뷰는 DR(재해 복구) 전략 선택 및 서비스 복구 프로세스의 책임 분리에 따라 시나리오 배포를 다루는 섹션을 지원합니다.
DR 영향 및 고객 활동
다음 섹션에서는 다양한 영향의 DR 이벤트에서 필요한 Contoso 작업 내역을 제공합니다.
영역: 기본 구성 요소
역할 자격을 포함한 Microsoft Entra ID
- Contoso SKU 선택: 프리미엄 P1
- DR 영향
- Azure 데이터 센터 오류: 해당 사항
- 가용성 영역 오류: 해당 사항
- Azure 지역 오류: 해당 사항
관리 그룹
- Contoso SKU 선택: 해당 없음
- DR 영향
- Azure 데이터 센터 오류: 해당 사항
- 가용성 영역 오류: 해당 사항
- Azure 지역 오류: 해당 사항
구독
- Contoso SKU 선택: 해당 없음
- DR 영향
- Azure 데이터 센터 오류: 해당 사항
- 가용성 영역 오류: 해당 사항
- Azure 지역 오류: 해당 사항
Azure Key Vault
- Contoso SKU 선택: 표준
- DR 영향
- Azure 데이터 센터 오류: 해당 사항
- 가용성 영역 오류: 해당 사항
- Azure 지역 오류: 해당 사항
Azure Monitor
- Contoso SKU 선택: 해당 없음
- DR 영향
- Azure 데이터 센터 오류: 해당 사항
- 가용성 영역 오류: 해당 사항
- Azure 지역 오류: 해당 사항
Microsoft Defender for Cloud
- Contoso SKU 선택: 해당 없음
- DR 영향
- Azure 데이터 센터 오류: 해당 사항
- 가용성 영역 오류: 해당 사항
- Azure 지역 오류: 해당 사항
Cost Management
- Contoso SKU 선택: 해당 없음
- DR 영향
- Azure 데이터 센터 오류: 해당 사항
- 가용성 영역 오류: 해당 사항
- Azure 지역 오류: 해당 사항
Azure DNS
- Contoso SKU 선택: 해당 없음
- DR 영향
- Azure 데이터 센터 오류: 해당 사항
- 가용성 영역 오류: 해당 사항
- Azure 지역 오류: 해당 사항
Network Watcher
- Contoso SKU 선택: 해당 없음
- DR 영향
- Azure 데이터 센터 오류: 해당 사항
- 가용성 영역 오류: 해당 사항
- Azure 지역 오류: 해당 사항
Recovery Services 자격 증명 모음
- Contoso SKU 선택: 기본값(GRS(지역 중복 스토리지))
- DR 영향
- Azure 데이터 센터 오류: 해당 사항
- 가용성 영역 오류: 해당 사항
- Azure 지역 오류: 해당 사항
- 참고
- 지역 간 복원 을 사용하면 DR 드릴과 고객이 보조 지역으로 장애 조치(failover)할 수 있습니다.
서브넷, UDR(사용자 정의 경로) 및 NSG(네트워크 보안 그룹)를 포함한 VNet(가상 네트워크)
- Contoso SKU 선택: 해당 없음
- DR 영향
- Azure 데이터 센터 오류: 해당 사항
- 가용성 영역 오류: 해당 사항
- Azure 지역 오류: Contoso는 연결된 UDR 및 NSG를 사용하여 Foundation 및 Data Platform VNet을 보조 지역에 다시 배포해야 합니다.
- 참고
- Traffic Manager를 사용하여 복제본 VNet 구조를 가지는 지역 간에 트래픽을 라우팅할 수 있습니다. 주소 공간이 같으면 라우팅 문제가 발생하므로 온-프레미스 네트워크에 연결할 수 없습니다. 한 지역에서 재해 및 VNet 손실이 발생할 경우 주소 공간이 온-프레미스 네트워크의 주소 공간과 일치하는 사용 가능한 지역의 다른 VNet을 연결할 수 있습니다.
리소스 그룹
- Contoso SKU 선택: 해당 없음
- DR 영향
- Azure 데이터 센터 오류: 해당 사항
- 가용성 영역 오류: 해당 사항
- Azure 지역 오류: Contoso는 Foundation 및 Data Platform 리소스 그룹을 보조 지역에 다시 배포해야 합니다.
- 참고
- 이 작업은 "웜 스페어" 전략을 구현하여 보조 지역에서 네트워크 및 리소스 그룹 토폴로지 사용 가능으로 완화됩니다.
Azure Firewall
- Contoso SKU 선택: 표준
- DR 영향
- Azure 데이터 센터 오류: 해당 사항
- 가용성 영역 오류: Contoso는 가용성의 유효성을 검사하고 필요한 경우 다시 배포해야 합니다.
- Azure 지역 오류: Contoso는 Foundation Azure Firewalls를 보조 지역에 다시 배포해야 합니다.
- 참고
- 가용성을 높이기 위해 가용성 영역 사용하여 Azure Firewall을 만들 수 있습니다.
- "웜 스페어" 전략은 이 활동을 완화합니다.
Azure DDoS
- Contoso SKU 선택: 네트워크 보호
- DR 영향
- Azure 데이터 센터 오류: 해당 사항
- 가용성 영역 오류: 해당 사항
- Azure 지역 오류: Contoso는 보조 지역 내에서 Foundation의 VNet에 대한 DDoS 보호 계획을 만들어야 합니다.
ExpressRoute – 회로
- Contoso SKU 선택: 표준
- DR 영향
- Azure 데이터 센터 오류: 해당 사항
- 가용성 영역 오류: 해당 사항
- Azure 지역 오류: 해당 사항
- 참고
- 물리적 회로는 복구할 Microsoft 및 연결 파트너의 책임으로 유지됩니다.
VPN Gateway
- Contoso SKU 선택: VpnGw1
- DR 영향
- Azure 데이터 센터 오류: 해당 사항
- 가용성 영역 오류: Contoso는 가용성의 유효성을 검사하고 필요한 경우 다시 배포해야 합니다.
- Azure 지역 오류: Contoso는 Foundation VPN Gateway를 보조 지역에 다시 배포해야 합니다.
- 참고
- 가용성 향상을 위해 가용성 영역 사용하여 VPN Gateway를 만들 수 있습니다.
- "웜 스페어" 전략은 이 활동을 완화합니다.
Load Balancer
Azure DevOps
- Contoso SKU 선택: DevOps Services
- DR 영향
- Azure 데이터 센터 오류: 해당 사항
- 가용성 영역 오류: 해당 사항
- Azure 지역 오류: 해당 사항
- 참고
- DevOps Services는 Azure 백본을 기반으로 하며 지역 복제와 함께 Azure Blob Storage를 사용하여 복원력을 보장합니다.
영역: 데이터 플랫폼 구성 요소
스토리지 계정 – Azure Data Lake Gen2
- Contoso SKU 선택: LRS(로컬 중복 스토리지)
- DR 영향
- Azure 데이터 센터 오류: 해당 사항
- 가용성 영역 오류: Contoso는 가용성의 유효성을 검사하고 필요한 경우 다시 배포해야 합니다.
- Azure 지역 오류: Contoso는 데이터 플랫폼 스토리지 계정을 다시 배포하고 보조 지역의 데이터로 리하일레이트해야 합니다.
- 참고
- 스토리지 계정에는 주 지역 중복에서 보조 지역 중복까지 광범위한 데이터 중복 옵션이 있습니다.
- 보조 지역의 경우 중복 데이터는 보조 지역에 비동기적으로 복제됩니다. 주 지역을 복구할 수 없는 경우 주 지역에 영향을 미치는 오류가 발생하면 데이터가 손실될 수 있습니다. Azure Storage에는 일반적으로 RPO(복구 지점 목표)가 15분 미만입니다.
- 지역 중단의 경우 지역 중복인 스토리지 계정은 보조 지역에서 LRS로 사용할 수 있습니다. 보조 지역에서 이러한 구성 요소를 지역 중복으로 향상하려면 추가 구성을 적용해야 합니다.
Azure Synapse - 파이프라인
- Contoso SKU 선택: 컴퓨팅 최적화 Gen2
- DR 영향
- Azure 데이터 센터 오류: 해당 사항
- 가용성 영역 오류: 해당 사항
- Azure 지역 오류: Contoso는 데이터 플랫폼 Azure Synapse Analytics를 보조 지역으로 배포 및 복원 하고 파이프라인을 다시 배포해야 합니다.
- 참고
- 자동 복원 지점은 7일 후에 삭제됩니다.
- 사용자 정의 복원 지점을 사용할 수 있습니다. 현재 7일 후에 자동으로 삭제되는 42개의 사용자 정의 복원 지점의 최대값이 있습니다.
- Synapse는 로컬 또는 원격 지역에서 DB 복원을 수행한 다음 인스턴스를 즉시 일시 중지할 수도 있습니다. 이 프로세스에는 스토리지 비용만 발생하며 컴퓨팅 비용은 0입니다. 이렇게 하면 특정 간격으로 "라이브" DB 복사본을 유지할 수 있습니다.
Azure Event Hubs
- Contoso SKU 선택: 표준
- DR 영향
- Azure 데이터 센터 오류: 해당 사항
- 가용성 영역 오류: 해당 사항
- Azure 지역 오류: Contoso는 Event Hubs 인스턴스를 보조 지역에 다시 배포해야 합니다.
- 참고
- Azure Portal을 사용하는 경우 가용성 영역에 대한 지원을 통한 영역 중복성이 자동으로 사용하도록 설정되며, Azure CLI 또는 PowerShell 명령을 사용하여 사용하지 않도록 설정할 수 있습니다.
- 지역 재해 복구를 통해 전체 지역 중단 을 처리하도록 이 복원력을 확장할 수 있습니다.
Azure IoT Hubs
- Contoso SKU 선택: 표준
- DR 영향
- Azure 데이터 센터 오류: 해당 사항
- 가용성 영역 오류: 해당 사항
- Azure 지역 오류: Contoso는 IoT Hub를 보조 지역에 다시 배포해야 합니다.
- 참고
- IoT Hub는 지역 내 HA를 제공하며 미리 정의된 Azure 지역 집합에서 만든 경우 가용성 영역을 자동으로 사용합니다.
Azure Stream Analytics
- Contoso SKU 선택: 표준
- DR 영향
- Azure 데이터 센터 오류: 해당 사항
- 가용성 영역 오류: 해당 사항
- Azure 지역 오류: Contoso는 IoT Hub를 보조 지역에 다시 배포해야 합니다.
- 참고
- Stream Analytics의 주요 기능은 노드 오류에서 복구하는 기능입니다.
Azure AI 서비스(이전 Cognitive Services)
- Contoso SKU 선택: 용량제
- DR 영향
- Azure 데이터 센터 오류: 해당 사항
- 가용성 영역 오류: 해당 사항
- Azure 지역 오류: 해당 사항
Azure Machine Learning
- Contoso SKU 선택: 범용 – D 시리즈 인스턴스
- DR 영향
- Azure 데이터 센터 오류: Contoso는 가용성의 유효성을 검사하고 필요한 경우 다시 배포해야 합니다.
- 가용성 영역 오류: Contoso는 가용성의 유효성을 검사하고 필요한 경우 다시 배포해야 합니다.
- Azure 지역 오류: Contoso는 Machine Learning을 보조 지역에 다시 배포해야 합니다.
- 참고
- Machine Learning 인프라는 Microsoft에서 관리하지만, 연결된 리소스는 고객이 관리합니다. Key Vault만 기본적으로 고가용성입니다.
- 지원되는 서비스 중요도에 따라 Microsoft는 다중 지역 배포를 권장합니다.
Azure Synapse – Data Explorer 풀
- Contoso SKU 선택: 계산 최적화됨, 작음(4코어)
- DR 영향
- Azure 데이터 센터 오류: 해당 사항
- 가용성 영역 오류: 해당 사항
- Azure 지역 오류: Contoso는 Azure Synapse – 데이터 탐색기 풀 및 파이프라인을 보조 지역에 다시 배포해야 합니다.
Azure Synapse – Spark 풀
- Contoso SKU 선택: 컴퓨팅 최적화 Gen2
- DR 영향
- Azure 데이터 센터 오류: 해당 사항
- 가용성 영역 오류: 해당 사항
- Azure 지역 오류: Contoso는 Azure Synapse – Spark 풀 및 파이프라인을 보조 지역에 다시 배포해야 합니다.
- 참고
- 외부 Hive 메타스토어를 사용하는 경우 복구 전략도 필요합니다.
- Azure Site Recovery 는 SQL Server 메타스토어에 사용할 수 있습니다.
- MySQL 메타스토어는 지역 복원 기능 또는 지역 간 읽기 복제본을 사용합니다.
- 외부 Hive 메타스토어를 사용하는 경우 복구 전략도 필요합니다.
Azure Synapse – 서버리스 및 전용 SQL 풀
- Contoso SKU 선택: 컴퓨팅 최적화 Gen2
- DR 영향
- Azure 데이터 센터 오류: 해당 사항
- 가용성 영역 오류: 해당 사항
- Azure 지역 오류: Contoso는 데이터 플랫폼 Azure Synapse Analytics를 보조 지역으로 배포하고 복원 해야 합니다.
- 참고
- 자동 복원 지점은 7일 후에 삭제됩니다.
- 사용자 정의 복원 지점을 사용할 수 있습니다. 현재 7일 후에 자동으로 삭제되는 42개의 사용자 정의 복원 지점의 최대값이 있습니다.
- Synapse는 로컬 또는 원격 지역에서 DB 복원을 수행한 다음 인스턴스를 즉시 일시 중지할 수도 있습니다. 여기에는 스토리지 비용만 발생하며 컴퓨팅 비용은 0입니다. 이 솔루션은 특정 간격으로 "라이브" DB 복사본을 유지하는 방법을 제공합니다.
Power BI
- Contoso SKU 선택: Power BI Pro
- DR 영향
- Azure 데이터 센터 오류: 해당 사항
- 가용성 영역 오류: 해당 사항
- Azure 지역 오류: 해당 사항
- 참고
- Power BI 팀에서 중단을 결정/선언하는 경우 고객은 아무 작업도 수행할 필요가 없습니다.
- 장애 조치(failover) Power BI 서비스 인스턴스는 읽기 작업만 지원합니다. 직접 쿼리 또는 라이브 연결을 사용하는 보고서는 장애 조치(failover) 중에 작동하지 않습니다.
- Power BI 팀에서 중단을 결정/선언하는 경우 고객은 아무 작업도 수행할 필요가 없습니다.
Azure Cosmos DB
- Contoso SKU 선택: 주기적인 백업을 사용하여 단일 지역 쓰기
- DR 영향
- Azure 데이터 센터 오류: 해당 사항
- 가용성 영역 오류: 해당 사항
- Azure 지역 오류: Contoso는 읽기 및 쓰기 작업을 지원하기 위해 나머지 지역에 충분한 프로비전된 RU(요청 단위) 가 있는지 모니터링해야 합니다.
- 참고
- 단일 지역 계정은 지역 중단으로 인해 가용성이 손실될 수도 있습니다. Azure Cosmos DB 인스턴스의 고가용성을 보장하려면 단일 쓰기 지역 및 최소 1초(읽기) 지역으로 구성하고 서비스 관리 장애 조치(failover)를 사용하도록 설정합니다.
- 쓰기 가용성 손실을 방지하기 위해 프로덕션 워크로드를 "서비스 관리 장애 조치(failover) 사용"으로 구성하여 사용 가능한 지역에 자동 장애 조치(failover)를 사용하도록 설정하는 것이 좋습니다.
Azure AI Search(기존의 Cognitive Search)
- Contoso SKU 선택: 표준 S1
- DR 영향
- Azure 데이터 센터 오류: Contoso는 가용성의 유효성을 검사하고 필요한 경우 다시 배포해야 합니다.
- 가용성 영역 오류: Contoso는 가용성의 유효성을 검사하고 필요한 경우 다시 배포해야 합니다.
- Azure 지역 오류: Contoso는 AI Search를 보조 지역에 다시 배포해야 합니다.
- 참고
- 재해 복구를 위한 기본 제공 메커니즘은 없습니다.
- 가용성 영역에서 여러 AI Search 복제본을 구현하면 데이터 센터 중단 위험을 해결할 수 있습니다 .
Azure Data Share
Purview
- Contoso SKU 선택: 해당 없음
- DR 영향
- Azure 데이터 센터 오류: 해당 사항
- 가용성 영역 오류: Contoso는 가용성의 유효성을 검사하고 필요한 경우 다시 배포해야 합니다.
- Azure 지역 오류: Contoso는 Microsoft Purview 인스턴스를 보조 지역에 배포해야 합니다.
- 참고
- 이 작업은 보조 지역에서 사용할 수 있는 Azure Microsoft Purview의 두 번째 인스턴스를 갖는 "웜 스페어" 전략을 구현하여 완화됩니다.
- "웜 스페어" 접근 방식에는 다음과 같은 주요 설명선이 있습니다.
- 기본 및 보조 Azure Microsoft Purview 계정은 해당하는 경우 동일한 Azure 데이터 팩터리, Azure Data Share 및 Azure Synapse Analytics 계정으로 구성할 수 없습니다. 따라서 Azure Data Factory 및 Azure Data Share의 계보는 보조 Azure Microsoft Purview 계정에서 볼 수 없습니다.
- 통합 런타임은 Azure Microsoft Purview 계정과 관련이 있습니다. 따라서 기본 및 보조 Azure Microsoft Purview 계정에서 병렬로 검사를 실행해야 하는 경우 여러 자체 호스팅 통합 런타임을 유지 관리해야 합니다.
참고 항목
이 섹션은 일반적인 지침으로 제공됩니다. 재해 복구, 중복성 및 백업에 대한 공급업체의 설명서에서 고려 중인 새 구성 요소 또는 서비스에 대한 올바른 접근 방식을 참조해야 합니다.
"Azure 데이터 센터 오류"는 영향을 받는 지역에 가용성 영역 제공되지 않는 상황을 다룹니다.
재해 이벤트 지점에서 새/업데이트된 구성 또는 릴리스가 발생한 경우 플랫폼을 현재 날짜로 가져오기 위한 작업의 일부로 확인 및 다시 배포해야 합니다(필요한 경우).
다음 단계
시나리오 세부 정보에 대해 알아보았으므로 이 시나리오와 관련된 권장 사항에 대해 알아볼 수 있습니다.