다음을 통해 공유


Azure Operator Nexus의 안정성

Important

이 기능은 현지 미리 보기로 제공됩니다. 추가 사용 약관에 동의하는 조건으로 미리 보기를 사용할 수 있습니다.

이 문서에서는 Azure Operator Nexus의 안정성 지원과 가용성 영역의 지역 내 복원력을 다룹니다. Azure의 안정성에 대한 포괄적인 개요는 Azure 안정성을 참조하세요.

가용성 영역 지원

가용성 영역은 각 Azure 지역 내에서 물리적으로 별도의 데이터 센터 그룹입니다. 한 영역이 실패하면 서비스가 나머지 영역 중 하나로 장애 조치(failover)될 수 있습니다.

Azure의 가용성 영역에 대한 자세한 내용은 가용성 영역이란?을 참조하세요.

Azure Operator Nexus는 기본적으로 가용성 영역 중복 배포를 제공합니다. 클러스터 관리자 및 네트워크 패브릭 컨트롤러와 같은 운영자 Nexus 구성 요소는 모두 가용성 영역에서 사용하도록 설정된 AKS(Azure Kubernetes Service) 클러스터에 배포됩니다. 스토리지 계정 서비스 및 KeyVault와 같은 다른 서비스 종속성도 가용성 영역 중복성으로 구성됩니다.

참고 항목

운영자 Nexus 온-프레미스 인스턴스는 스택의 모든 수준에서 물리적 중복성을 제공하는 다중 랙 디자인을 구현합니다. 각 랙은 오류 도메인 또는 Nexus 영역으로 설계되었습니다. 고객 워크로드를 여러 랙/노드에 배포하여 기본적으로 유사한 다중 가용성 영역 환경을 제공할 수 있습니다.

Azure 가용성 영역 다운 환경

가용성 영역 다운 시나리오에서 클러스터 및 리소스 공급자에 대한 API 호출은 중단 없이 계속 작동합니다. 현재 실행 중인 온-프레미스 테넌트 워크로드 또는 새 테넌트 워크로드를 만드는 기능에는 영향을 주지 않습니다. 또한 운영자 Nexus 및 기타 리소스 유형의 복원력이 보장되므로 데이터 손실이 발생하지 않아야 합니다.

Azure 가용성 영역 장애 조치(failover) 지원

가용성 영역이 실패하는 경우 다른 Azure 가용성 영역에 다시 연결하는 것은 자동이며 사용자의 상호 작용이 필요하지 않습니다.

운영자 Nexus 인스턴스 배포의 가용성

Azure 운영자 Nexus 워크로드 배포에서 가용성을 보장하는 것은 분할된 책임입니다. 이전 섹션에서 설명한 대로 운영자 Nexus AKS 기반 리소스는 가용성 영역 중복을 사용하여 배포됩니다. 이 섹션에서는 온-프레미스 워크로드 가용성에 대한 모범 사례를 고려합니다.

일반적으로 가용성 목표는 로컬 및 지역 중복 배포를 통해 달성됩니다.

Nexus 영역: 로컬 워크로드 중복을 위한 메커니즘

운영자 Nexus 온-프레미스 인스턴스는 스택의 모든 수준에서 물리적 중복성을 제공하는 다중 랙 디자인으로 구성됩니다. 각 랙은 오류 도메인으로 지정되므로 이러한 영역이 로컬 중복 워크로드 배포에 사용할 수 있는 Nexus 영역으로 구성할 수 있습니다.

Nexus 인스턴스: 지역 워크로드 중복을 위한 메커니즘

Nexus 온-프레미스 인스턴스는 특정 Azure 지역에서 호스트됩니다. 앞에서 설명한 대로 사용된 Azure 서비스 및 Nexus 리소스는 해당 Azure 지역의 여러 가용성 영역에 배포됩니다.

지리적으로 분산된 Nexus 인스턴스(즉, 동일한 연산자 데이터 센터(동일한 지리적 지역도 아님)에 있지 않은 경우 다른 Azure 지역에서 호스트되며 지역 중복성을 위해 워크로드를 중복 배포하는 데 활용되어야 합니다.

Warning

예를 들어 지리적으로 분산된 두 개의 Nexus 인스턴스에 워크로드를 배포하는 것은 지역 중복 Nexus 인스턴스가 다른 Azure 지역에서 호스트되지 않는 한 진정한 지역 중복성을 달성하기에 충분하지 않습니다.

Azure 지역을 사용할 수 없게 되는 드문 경우 Azure 서비스 및 해당 지역의 Nexus 리소스도 사용할 수 없게 됩니다. 이는 실행 중인 워크로드에 영향을 주지 않지만 새 워크로드, 분석 등의 시작과 같은 기능을 방지합니다.

동일한 지리적 위치에 있는 여러 Nexus 인스턴스

여러 Nexus 인스턴스를 동일한 지리적 위치에 배포해야 하는 시나리오가 있습니다. 동일한 지리적 위치에 있는 Nexus 인스턴스에 워크로드를 배포하면 워크로드 지역 중복성이 분명히 달성되지 않습니다.

가용성 이외의 안정성 설계에서 한 가지 고려 사항은 복원력과 오류로부터 복구할 수 있는 기능입니다. 오류로부터의 복구 및 복구 시간 목표를 충족하는 기능을 사용하려면 오류의 "폭발" 또는 영향 반경을 제한해야 합니다. 여러 Nexus 인스턴스가 동일한 지리적 위치에 배포되는 시나리오에서 복원력 있는 디자인에서는 이러한 Nexus 인스턴스를 다른 Azure 지역에서 호스트해야 합니다. 따라서 Azure 지역이 실패하면 해당 영향은 하나의 Nexus 인스턴스로 제한됩니다.

다음 단계