Azure ExpressRoute를 사용하여 고가용성을 위한 디자인
Azure ExpressRoute는 고가용성을 위해 설계되어 Microsoft 리소스에 대한 통신 사업자급 프라이빗 네트워크 연결을 제공합니다. 즉, Microsoft 네트워크 내에 단일 실패 지점이 없습니다. 가용성을 최대화하려면 Azure ExpressRoute 회로의 고객 및 서비스 공급자 세그먼트도 모두 고가용성을 위해 설계되어야 합니다. 이 문서에서는 Azure ExpressRoute 회로의 고가용성을 개선하기 위해 Azure ExpressRoute 및 미세 조정 기능을 사용하여 강력한 연결을 구축하기 위한 네트워크 아키텍처 고려 사항을 설명합니다.
참고 항목
이 문서에 설명된 개념은 Azure ExpressRoute 회로가 Virtual WAN 아래 또는 그 외부에 생성되는지에 관계없이 동일하게 적용됩니다.
아키텍처 고려 사항
다음 그림에서는 가용성을 최대화하기 위해 Azure ExpressRoute 회로를 사용하여 연결하는 권장 방법을 보여 줍니다.
고가용성을 위해서는 엔드 투 엔드 네트워크 전체에서 중복성을 유지해야 합니다. 즉, 온-프레미스 네트워크 내에서 중복성을 유지하고 서비스 공급자 네트워크 내에서 중복성을 손상시키지 않습니다. 최소한 네트워크 오류의 단일 지점을 방지해야 합니다. 네트워크 디바이스에 대한 중복 전원 및 냉각은 고가용성을 더욱 향상시킵니다.
퍼스트 마일 물리적 계층 설계 고려 사항
동일한 CPE(Customer Premises Equipment)에서 Azure ExpressRoute 회로의 기본 및 보조 연결을 모두 종료하면 온-프레미스 네트워크 내에서 고가용성이 손상됩니다. 또한 CPE의 동일한 포트를 사용하여 두 연결을 구성하면 파트너가 네트워크 세그먼트에서 고가용성을 손상하게 됩니다. 이 문제는 아래 그림과 같이 서로 다른 하위 표면에서 두 연결을 종료하거나 파트너 네트워크 내에서 두 연결을 병합하여 발생할 수 있습니다.
다른 지리적 위치에서 Azure ExpressRoute 회로의 기본 및 보조 연결을 종료하면 네트워크 성능이 저하됩니다. 서로 다른 위치에서 종료된 연결 간에 트래픽 부하가 적극적으로 분산되는 경우 두 경로 간의 네트워크 대기 시간의 상당한 차이로 인해 최적이 아니면 성능이 저하될 수 있습니다.
지역 중복 디자인 고려 사항은 Azure ExpressRoute를 사용하여 재해 복구를 위한 설계를 참조 하세요.
활성-활성 연결
Microsoft 네트워크에서는 Azure ExpressRoute 회로의 기본 및 보조 연결이 액티브-액티브 모드로 작동합니다. 그러나 경로 광고를 통해 중복 연결이 활성-수동 모드로 작동하도록 강제할 수 있습니다. 더 구체적인 경로를 보급하고 BGP AS 경로 앞에 추가하는 것은 한 경로를 다른 경로보다 선호하는 일반적인 기술입니다.
고가용성을 향상하려면 활성-활성 모드에서 두 연결을 모두 작동하는 것이 좋습니다. 이를 통해 Microsoft 네트워크는 흐름별로 연결 간에 트래픽 부하를 분산할 수 있습니다.
활성-수동 모드에서 연결을 실행하면 활성 경로가 실패할 경우 두 연결이 모두 실패할 수 있습니다. 실패의 일반적인 원인으로는 수동 연결의 활성 관리 부족 및 수동 연결 광고 부실 경로가 있습니다.
또는 활성-활성 모드에서 연결을 실행하면 흐름의 절반 정도만 실패하고 다시 라우팅되어 MTTR(평균 복구 시간)이 크게 향상됩니다.
참고 항목
한 연결에 영향을 미치는 유지 관리 또는 계획되지 않은 이벤트 중에 Microsoft는 AS 경로 앞에 추가하여 트래픽을 정상 연결로 드레이닝합니다. Microsoft에서 경로 앞에 추가를 구성하고 서비스 중단을 방지하기 위해 필요한 경로 알림을 적절하게 설정할 때 트래픽이 정상 경로를 통해 라우팅할 수 있는지 확인합니다.
Microsoft 피어링을 위한 NAT
Microsoft 피어링은 퍼블릭 엔드포인트 간의 통신을 위해 설계되었습니다. 일반적으로 온-프레미스 프라이빗 엔드포인트는 Microsoft 피어링을 통해 통신하기 전에 고객 또는 파트너 네트워크의 공용 IP를 사용하여 NATed(네트워크 주소 변환)입니다. 활성-활성 설정에서 기본 및 보조 연결을 모두 사용하면 연결 중 하나의 오류에서 복구하는 데 얼마나 빨리 영향을 줍니다. 아래에는 두 가지 NAT 옵션이 나와 있습니다.
옵션 1:
NAT는 기본 연결과 보조 연결 간에 트래픽을 분할한 후 적용됩니다. 독립 NAT 풀은 상태 저장 NAT 요구 사항을 충족하기 위해 기본 및 보조 디바이스에 사용됩니다. 반환 트래픽은 흐름이 송신된 동일한 에지 디바이스에 도착합니다.
Azure ExpressRoute 연결이 실패하면 해당 NAT 풀에 연결할 수 없게 되어 모든 네트워크 흐름이 중단됩니다. 이러한 흐름은 창 시간 제한 이후 TCP 또는 애플리케이션 계층에서 다시 설정해야 합니다. 실패하는 동안 Azure는 연결이 복원될 때까지 해당 NAT를 사용하여 온-프레미스 서버에 연결할 수 없습니다.
옵션 2:
공통 NAT 풀은 기본 연결과 보조 연결 간에 트래픽을 분할하기 전에 사용됩니다. 이렇게 하면 단일 실패 지점이 발생하지 않으므로 고가용성이 유지됩니다.
NAT 풀은 기본 또는 보조 연결이 실패하더라도 연결할 수 있으므로 네트워크 계층이 패킷을 다시 라우팅하고 더 빠르게 복구할 수 있습니다.
참고 항목
- NAT 옵션 1(기본 및 보조 연결을 위한 독립적인 NAT 풀)을 사용하고 한 NAT 풀에서 온-프레미스 서버로 IP 주소의 포트를 매핑하는 경우 해당 연결이 실패하는 경우 Azure ExpressRoute 회로를 통해 서버에 연결할 수 없습니다.
- 상태 저장 디바이스에서 Azure ExpressRoute BGP 연결을 종료하면 Microsoft 또는 Azure ExpressRoute 공급자의 계획되거나 계획되지 않은 유지 관리 중에 장애 조치(failover) 문제가 발생할 수 있습니다. 설치 프로그램을 테스트하여 적절한 장애 조치(failover)를 확인하고 가능한 경우 상태 비스테이션 디바이스에서 BGP 세션을 종료합니다.
프라이빗 피어링을 위한 미세 조정 기능
이 섹션에서는 Azure 배포 및 MTTR에 대한 민감도에 따라 Azure ExpressRoute 회로의 고가용성을 개선하는 데 도움이 되는 선택적 기능을 검토합니다. 특히 Azure ExpressRoute 가상 네트워크 게이트웨이 및 BFD(양방향 전달 검색)의 영역 인식 배포를 다룹니다.
가용성 영역 인식 Azure ExpressRoute 가상 네트워크 게이트웨이
Azure 지역의 가용성 영역은 장애 도메인과 업데이트 도메인을 결합합니다. 가장 높은 복원력과 가용성을 달성하려면 영역 중복 Azure ExpressRoute 가상 네트워크 게이트웨이를 구성합니다. 자세한 내용은 Azure 가용성 영역 영역 중복 가상 네트워크 게이트웨이 정보를 참조하세요. 영역 중복 가상 네트워크 게이트웨이를 구성하려면 Azure 가용성 영역에서 영역 중복 가상 네트워크 게이트웨이 만들기를 참조하세요.
오류 검색 시간 향상
Azure ExpressRoute는 프라이빗 피어링을 통해 BFD를 지원하여 MSE(Microsoft Enterprise Edge)와 온-프레미스 쪽의 BGP 인접 항목 간의 계층 2 네트워크를 통해 오류 검색 시간을 약 3분(기본값)에서 1초 미만으로 줄입니다. 빠른 오류 검색은 복구를 서두르는 데 도움이 됩니다. 자세한 내용은 Azure ExpressRoute를 통해 BFD 구성을 참조 하세요.
다음 단계
이 문서에서는 Azure ExpressRoute 회로의 고가용성을 위한 설계에 대해 설명했습니다. Azure ExpressRoute 회로 피어링 지점은 지리적 위치에 고정되며 전체 위치에 영향을 주는 치명적인 오류의 영향을 받을 수 있습니다.
전체 지역에 영향을 주는 치명적인 오류를 견딜 수 있는 Microsoft 백본에 대한 지역 중복 네트워크 연결을 빌드하기 위한 디자인 고려 사항은 Azure ExpressRoute 프라이빗 피어링을 사용하여 재해 복구를 위한 디자인을 참조 하세요.