재해 복구 훈련 수행 - Azure SQL Managed Instance
적용 대상: Azure SQL Managed Instance
애플리케이션이 복구 워크플로를 수행할 준비가 되었는지 주기적으로 테스트하고 유효성을 검사하는 것이 좋습니다. 애플리케이션 동작과 데이터 손실의 영향 및/또는 장애 조치(failover)와 관련된 중단을 검사하는 것은 적절한 엔지니어링 실무입니다. 또한 대부분의 업계 표준에서 비즈니스 연속성 인증의 일부로 요구하는 사항이기도 합니다.
재해 복구 훈련의 수행은 다음으로 구성됩니다.
- 데이터 계층 중단 시뮬레이션
- 복구
- 복구 후 애플리케이션 무결성 검사
비즈니스 연속성을 위한 애플리케이션 설계방법에 따라 연습을 실행하는 워크플로가 달라질 수 있습니다. 이 문서에서는 Azure SQL Managed Instance와 관련하여 재해 복구 훈련을 수행하는 모범 사례를 설명합니다.
지역 복원
재해 복구 훈련을 수행할 때 잠재적인 데이터 손실을 방지하려면, 프로덕션 환경의 복사본을 만들고 이를 애플리케이션의 장애 조치(failover) 워크플로를 검사하는 데 사용하는 방법으로 훈련을 수행합니다.
중단 시뮬레이션
중단을 시뮬레이트하기 위해 원본 데이터베이스의 이름을 바꿀 수 있습니다. 이와 같이 이름을 변경하면 애플리케이션 연결이 실패합니다.
복구
- 재해 복구 지침에 설명된 대로 다른 인스턴스로 데이터베이스의 지리적 복원을 수행합니다.
- 복구된 인스턴스에 연결하도록 애플리케이션 구성을 변경하고 복구 후 데이터베이스 구성 가이드에 따라 복구를 완료합니다.
유효성 검사
복구 후 애플리케이션 무결성 검사(연결 문자열, 로그인, 기본 기능 테스트 또는 기타 표준 애플리케이션 로그아웃 절차의 유효성 검사 부분 포함)로 훈련을 완료합니다.
장애 조치(failover) 그룹
장애 조치(failover) 그룹에 의해 보호되는 인스턴스의 경우에는 보조 인스턴스로의 계획된 장애 조치가 연습에 포함됩니다. 계획된 장애 조치는 역할이 전환될 때 장애 조치(failover) 그룹의 주 인스턴스와 보조 인스턴스가 동기화 상태로 유지되도록 합니다. 계획되지 않은 장애 조치(failover)와 달리 이 작업에서는 데이터가 손실되지 않으므로 프로덕션 환경에서 연습을 수행할 수 있습니다.
비즈니스 필요에 맞는 장애 조치(failover) 정책을 사용하여 장애 조치(failover) 그룹을 구성하고 장애 조치(failover) 정책을 구성하는 방법에 관계없이 장애 조치(failover)를 테스트합니다. 자세한 내용은 장애 조치(failover) 테스트에서 확인할 수 있습니다. 장애 조치(failover) 프로세스를 제어하려면 고객 관리 장애 조치(failover) 정책을 사용하는 것이 좋습니다.
Important
장애 조치(failover) 그룹의 인스턴스 간에 시스템 데이터베이스가 복제되지 않으므로 보조 인스턴스에서 시스템 개체를 수동으로 다시 만들고 시스템 개체 종속성을 사용하여 환경을 테스트하여 장애 조치(failover) 후에도 계속 제대로 작동하는지 확인합니다.
중단 시뮬레이션
중단을 시뮬레이션하기 위해 데이터베이스에 연결된 웹 애플리케이션 또는 가상 머신을 비활성화할 수 있습니다. 이와 같은 중단 시뮬레이션이 진행되면 웹 클라이언트에 대한 연결이 실패합니다.
복구
- DR 지역의 애플리케이션 구성이 완전히 액세스 가능한 새로운 주 데이터베이스가 될 이전의 보조 데이터베이스를 가리키는지 확인합니다.
- 보조 인스턴스에서 장애 조치(failover) 그룹의 계획된 장애 조치를 시작합니다.
- 복구 후 데이터베이스 구성 가이드에 따라 복구를 완료합니다.
유효성 검사
복구 후 애플리케이션 무결성 검사(연결, 기본 기능 테스트 또는 기타 훈련 로그아웃에 필요한 유효성 검사 포함)로 훈련을 완료합니다.
관련 콘텐츠
자세한 내용은 다음을 검토하세요.