다음을 통해 공유


Azure VMware Solution용 애플리케이션 성능 모니터링 및 문제 해결 솔루션

Azure VMware Solution의 주요 목표는 Azure 및 온-프레미스의 VMware에서 애플리케이션 및 서비스의 성능과 보안을 유지하는 것입니다. 이를 위해서는 복잡한 인프라에 대한 표시 유형과 하이브리드 클라우드 전반에서 서비스 중단의 근본 원인을 신속하게 찾아내야 합니다.

Microsoft 솔루션

Microsoft는 애플리케이션 및 서비스의 가용성과 성능을 최대화하기 위해 Azure Monitor의 기능인 Application Insights를 권장합니다.

제품 개요, 기능, 시작 안내서 등을 검토하여 Azure Monitor를 사용한 최신 모니터링이 어떻게 비즈니스를 혁신할 수 있는지 알아봅니다.

Azure VMware Solution 프라이빗 클라우드용 Azure Resource Health(공개 미리 보기)

이 문서에서는 Azure Resource Health가 프라이빗 클라우드 리소스에 영향을 주는 서비스 문제를 진단하고 지원하는 데 어떻게 도움이 되는지 알아봅니다. Azure Resource Health는 프라이빗 클라우드 인프라 리소스의 현재 및 과거 상태를 보고하고 인프라 리소스의 상태에 대한 개인 설정된 대시보드를 제공합니다. Azure Resource Health를 사용하면 기록 이벤트를 보고할 수 있으며 서비스를 사용할 수 없을 때마다와 SLA(서비스 수준 계약)를 위반했는지 식별할 수 있습니다.

미리 보기 사용

Azure Portal에서 Azure VMware Solution의 미리 보기 기능에서 기능 미리 보기에 등록해야 합니다. 고객은 먼저 Azure Portal에서 "Microsoft.AVS/ResourceHealth" 미리 보기 플래그에 등록해야 하며 등록되면 호스트 교체, vCenter 및 기타 중요 경보와 관련된 미리 구성된 모든 경고가 AVS(Azure VMware Solution) UI(사용자 인터페이스)의 Resource Health에 표시되기 시작합니다.

Resource Health를 사용하도록 설정하면 이점

  • Resource Health 기능 사용은 모니터링 기능에 상당한 가치를 더합니다. 프라이빗 클라우드 인프라에서 발생한 계획되지 않은 유지 관리에 대한 알림을 받습니다.

  • Resource Health는 개인화된 리소스 상태 대시보드를 제공합니다. Resource Health는 리소스를 사용할 수 없음을 항상 표시하므로 SLA가 위반되었는지 쉽게 확인할 수 있습니다.

  • 공개 미리 보기의 경우 호스트 교체, 스토리지 중요 경보 및 프라이빗 클라우드의 네트워크 상태에 대해 알리는 중요한 경고 그룹이 활성화됩니다.

  • 경고는 더 나은 보고 및 심사를 위해 필요한 모든 정보를 갖도록 업데이트됩니다.

  • Resource Health는 이메일/SMS/웹후크/ITSM을 구성하고 선택한 통신 방법을 통해 알림을 받을 수 있는 Azure 작업 그룹을 사용합니다.

  • 일단 사용하도록 설정하면 프라이빗 클라우드 인프라의 상태가 다음 상태를 반영합니다.

    • 사용 가능

    • Unavailable

    • 알 수 없음

    • 성능 저하됨

사용 가능

‘사용 가능’은 리소스의 상태에 영향을 주는 이벤트가 검색되지 않았음을 의미합니다. 지난 24시간 동안 계획되지 않은 가동 중지 시간에서 리소스가 복구된 경우 "최근에 해결됨" 알림이 표시됩니다.

사용할 수 없음

사용할 수 없음은 서비스가 리소스의 상태에 영향을 주는 진행 중인 플랫폼 또는 플랫폼이 아닌 이벤트를 검색했음을 의미합니다.

Unknown

‘알 수 없음’은 Resource Health가 리소스 관련 정보를 10분 넘게 받지 못했음을 의미합니다. 다음 두 가지 조건에서 이 상태가 표시될 수 있습니다.

  • Resource Health 메트릭에 대해 구독을 사용할 수 없으며 미리 보기에 등록해야 합니다.

  • 리소스가 예상한 대로 실행 중이면 몇 분 후 리소스 상태가 사용 가능으로 변경됩니다. 리소스에 문제가 발생하는 경우 알 수 없는 상태는 프라이빗 클라우드의 이벤트가 리소스에 영향을 미치고 있음을 의미할 수 있습니다.

성능 저하됨

성능 저하는 Resource Health가 하나 이상의 프라이빗 클라우드 리소스에서 성능 손실을 감지했음을 의미하지만 여전히 사용할 수 있습니다. 리소스마다 성능 저하를 보고하는 시기에 대한 고유한 기준이 있습니다.

Azure Resource Health에서 미리 구성된 경보 사용

경고 이름 수정 모드
물리적 디스크 상태 경보 시스템 수정
시스템 보드 상태 경보 시스템 수정
메모리 상태 경보 시스템 수정
스토리지 상태 경보 시스템 수정
온도 상태 경보 시스템 수정
호스트 연결 상태 경보 시스템 수정
HA(고가용성) 호스트 상태 시스템 수정
네트워크 연결 손실 경보 시스템 수정
vSAN(Virtual Storage) 호스트 디스크 오류 경보 시스템 수정
전압 상태 경보 시스템 수정
프로세서 상태 경보 시스템 수정
팬 상태 경보 시스템 수정
높은 pNIC 오류 비율이 검색됨 시스템 수정
하드웨어 오류가 있는 경우 iDRAC 중요 경고(CPU/DIMM/PCI 버스/전압 문제) 시스템 수정
vSphere HA가 가상 머신을 다시 시작했습니다. 시스템 수정
vSAN(Virtual Storage) 높은 디스크 사용률 고객 개입 필요
대체 시작 및 중지 알림 시스템 수정
고객에게 서비스 알림 복구(호스트 재부팅 및 관리 서비스 다시 시작) 시스템 수정
가상 머신이 유지 관리 작업을 방지하는 외부 디바이스를 사용하도록 구성된 경우 고객에게 알림 고객 개입 필요
CD-ROM이 Virtual Machine에 탑재되고 해당 ISO 이미지에 액세스할 수 없고 유지 관리 작업을 차단하는 경우 고객 알림 고객 개입 필요
탑재된 외부 데이터 저장소에 액세스할 수 없게 되어 유지 관리 작업을 차단할 때 고객에게 알림 고객 개입 필요
연결된 네트워크 어댑터에 액세스할 수 없게 되고 유지 관리 작업을 차단하는 경우 고객에게 알림 고객 개입 필요
VMware Network(NSX –T) 경보(라이선스 만료에 대한 고객 알림) 고객 개입 필요

다음 단계

이제 Azure VMware Solution 프라이빗 클라우드에 대한 경고 규칙을 구성했으므로 다음 사항에 대해 자세히 알아볼 수 있습니다.

다른 Azure VMware Solution 방법 가이드 중 하나를 계속 진행할 수도 있습니다.

타사 솔루션

Microsoft의 애플리케이션 성능 모니터링 및 문제 해결 파트너는 VMware 기반 환경에서 애플리케이션 및 서비스의 가용성, 안정성 및 응답성을 보장하는 업계 최고의 솔루션을 보유하고 있습니다. 온-프레미스 배포를 위해 VMware NSX-T 데이터 센터와 통합된 많은 솔루션을 채택할 수 있습니다. 주요 원칙 중 하나로, Azure에서 실행되는 투자 및 VMware 솔루션을 계속 사용할 수 있기를 바랍니다. 이러한 많은 ISV(독립 소프트웨어 공급업체)는 이미 Azure VMware Solution을 사용하여 솔루션의 유효성을 검사했습니다.

이러한 솔루션에 대한 자세한 내용은 여기에서 확인할 수 있습니다.