경고 및 자동화된 작업 계획
경고는 모니터링 데이터에서 식별된 중요한 데이터 또는 패턴을 사전에 알려줍니다. 다음과 같은 경고를 만들 수 있습니다.
- 자동 관리 알림을 보냅니다.
- 자동화된 작업을 시작하여 문제 해결을 시도합니다.
경고 규칙은 사용하는 데이터 형식에 따라 정의됩니다. 각 규칙에는 다양한 기능과 다양한 비용이 있습니다. 기본 전략은 필요한 논리를 제공하는 비용이 가장 낮은 경고 규칙 유형을 사용하는 것입니다. 올바른 유형의 경고 규칙 선택을 참조하세요.
경고에 대한 자세한 내용은 경고 개요를 참조하세요.
경고 전략
경고 전략을 정의하면 경고 심각도 및 작업 그룹을 포함한 경고 규칙의 구성을 정의하는 데 도움이 됩니다.
경고 전략을 개발할 때 고려해야 할 요소는 성공적인 경고 전략을 참조하세요.
경고에 대한 자동 응답
작업 그룹을 사용하여 경고에 대한 자동 응답을 정의합니다. 작업 그룹은 경고에 의해 트리거되는 하나 이상의 알림 및 작업의 컬렉션입니다. 단일 작업 그룹을 여러 경고 규칙과 함께 사용할 수 있으며 다음 항목 중 하나 이상을 포함할 수 있습니다.
- 알림: 경고가 만들어졌음을 운영자와 관리자에게 알리는 메시지입니다.
- 작업: 검색된 문제를 수정하려고 시도하는 자동화된 프로세스,
알림
알림은 경고가 만들어졌음을 알리기 위해 한 명 이상의 사용자에게 보내는 메시지입니다. 단일 작업 그룹을 여러 경고 규칙과 함께 사용할 수 있으므로 동일한 경고 집합을 수신할 다른 관리자 및 사용자 집합에 대해 작업 그룹 세트를 설계해야 합니다. 운영자의 기본 설정 및 조직 표준에 따라 다음 형식의 알림을 사용합니다.
- 메일
- SMS
- Azure 앱에 푸시
- 음성
- 이메일 Azure Resource Manager 역할
actions
작업은 경고에 대한 자동화된 응답입니다. 지원하는 모든 시나리오에 대해 사용 가능한 작업을 사용할 수 있지만 다음 섹션에서는 각 작업이 일반적으로 사용되는 방식에 대해 설명합니다.
자동 재구성
경고로 식별된 문제를 자동으로 수정하려면 다음 작업을 사용합니다.
- Automation Runbook: Azure Automation에서 기본 제공 또는 사용자 지정 Runbook을 시작합니다. 예를 들어 기본 제공 Runbook을 사용하여 가상 머신 다시 시작 또는 크기 조정과 같은 기능을 수행할 수 있습니다.
- Azure Functions: Azure 함수를 시작합니다.
ITSM 및 On-Call 관리
- ITSM(IT 서비스 관리): ITSM 커넥터를 사용하여 Azure Monitor의 경고를 기반으로 ITSM 도구에서 작업 항목을 만듭니다. 먼저 커넥터를 구성한 다음 경고 규칙에서 ITSM 작업을 사용합니다.
- 웹후크: PagerDuty 및 Splunk On-Call과 같은 웹후크를 지원하는 인시던트 관리 시스템에 경고를 보냅니다.
- 보안 웹후크: ITSM을 Microsoft Entra 인증과 통합합니다.
대규모 경고
경고 전략의 일환으로 모든 중요한 Azure 애플리케이션과 리소스에 대한 문제에 대한 경고를 활성화해야 합니다. 지침은 대규모 경고를 참조하세요.
경고 작업 최소화
사용자 환경에서 중요한 정보에 대한 경고를 만들려고 합니다. 그러나 이를 보증하지 않는 문제에 대해 과도한 경고 및 알림을 만들고 싶지는 않습니다. 경고 작업을 최소화하여 관리자를 위한 과도한 정보 및 알림을 생성하지 않으면서 중요한 문제가 노출되도록 하려면 다음 지침을 따릅니다.
- 성공적인 경고 전략을 참조하여 증상이 경고를 받을 수 있는 적절한 대상인지 확인하세요.
- 메트릭 경고 규칙의 자동으로 경고 해결 옵션을 사용하여 조건이 수정되었을 때 경고를 해결합니다.
- 동일한 문제에 대해 여러 개의 경고가 만들어지지 않도록 하려면 로그 검색 쿼리 경고 규칙에서 경고 표시 안 함 옵션을 사용합니다.
- 높은 우선 순위 문제가 분석될 수 있도록 경고 규칙에 대해 적절한 심각도 수준을 사용해야 합니다.
- 즉각적인 주의가 필요하지 않으므로 심각도가 경고(Warning) 이하인 경고에 대한 알림을 제한합니다.