Выбор правильного типа правила генерации оповещений
В этой статье описаны типы оповещений Azure Monitor, которые можно создать. Это помогает понять, когда следует использовать каждое оповещение. Дополнительные сведения о ценах см. на странице цен.
Типы оповещений:
- Оповещения на основе метрик
- Оповещения поиска по журналам
- Оповещения на основе журнала действий
- Оповещения интеллектуального обнаружения
- Оповещения Prometheus
Типы оповещений Azure Monitor
Тип оповещения | Когда использовать | Сведения о ценах |
---|---|---|
Оповещение о метрике | Данные метрик хранятся в системе, уже предварительно вычисляемой. Оповещения о метриках полезны, если вы хотите получать оповещения о данных, с которыми требуется выполнять минимальные действия. Используйте оповещения метрик, если данные, которые вы хотите отслеживать, доступны в данных метрик. | Каждое правило генерации оповещений метрик взимается в зависимости от количества отслеживаемых временных рядов. |
Оповещение поиска по журналам | Вы можете использовать оповещения поиска по журналам для выполнения расширенных операций логики с данными. Если данные, которые требуется отслеживать, доступны в журналах или требуют расширенной логики, можно использовать надежные функции язык запросов Kusto (KQL) для обработки данных с помощью оповещений поиска по журналам. | Каждое правило генерации оповещений поиска по журналам выставляется в зависимости от интервала, с которым вычисляется запрос журнала. Более частое вычисление запросов приводит к более высокой стоимости. Для оповещений поиска по журналам, настроенных для мониторинга в масштабе с помощью разбиения по измерениям, стоимость также зависит от количества временных рядов, созданных измерениями, полученными от запроса. |
Оповещение журнала действий. | Журналы действий обеспечивают аудит всех действий, произошедших с ресурсами. Используйте оповещения журнала действий для оповещения, когда определенное событие происходит с ресурсом, например перезапуском, завершением работы или созданием или удалением ресурса. Оповещения о работоспособности служб и Работоспособность ресурсов оповещений позволяют узнать, когда возникает проблема с одной из служб или ресурсов. | Дополнительные сведения см. на странице цен. |
Оповещения Prometheus | Оповещения Prometheus используются для оповещения метрик Prometheus, хранящихся в управляемых службах Azure Monitor для Prometheus. Правила генерации оповещений основаны на языке запросов с открытым исходным кодом PromQL. | Правила генерации оповещений Prometheus взимается только за данные, запрашиваемые правилами. Дополнительные сведения см. на странице цен. |
Оповещения метрики
Правило генерации оповещений по метрике отслеживает ресурс, оценивая условия для метрик ресурсов через регулярные интервалы. При соблюдении условий создается оповещение. Временные ряды метрик — это ряд значений метрик, зарегистрированных за определенный период времени.
Вы можете создавать правила с помощью следующих метрик:
- Метрики платформы
- Пользовательские метрики
- Пользовательские метрики Application Insights
- Выбранные журналы из рабочей области Log Analytics, преобразованные в метрики
Правила генерации оповещений по метрикам включают следующие функции:
- Для одного ресурса можно использовать несколько условий в правиле генерации оповещений.
- Вы можете детализировать данные с помощью мониторинга нескольких измерений метрик.
- Вы можете использовать динамические пороговые значения, управляемые машинным обучением.
- Вы можете настроить оповещения по метрикам как оповещения с отслеживанием состояния или без него. По умолчанию используются оповещения по метрикам с отслеживанием состояния.
Целевым объектом правила генерации оповещений по метрикам может быть:
- Один ресурс, например виртуальная машина. Поддерживаемые типы ресурсов см. в разделе "Поддерживаемые ресурсы".
- Несколько ресурсов одного типа в одном регионе Azure, например группа ресурсов.
Применение нескольких условий к правилу генерации оповещений метрик
При создании правила генерации оповещений для отдельного ресурса вы можете применить несколько условий. Например, вы можете создать правило генерации оповещений для отслеживания виртуальной машины Azure и создания оповещения в том случае, когда выполняются условия "Процент ЦП превышает 90 %" и "Длина очереди превышает 300 элементов". Если правило генерации оповещений имеет несколько условий, оповещение создается, когда все условия в правиле генерации оповещений верны, и разрешается, если хотя бы одно из условий больше не соответствует трем последовательным проверкам.
Сузить целевой объект с помощью измерений
Инструкции по использованию измерений в правилах генерации оповещений метрик см. в разделе "Мониторинг нескольких временных рядов" в одном правиле генерации оповещений метрик.
Мониторинг одного и того же условия для нескольких ресурсов с помощью разделения по измерениям
Чтобы отслеживать одно условие для нескольких ресурсов Azure, вы можете использовать разделение по измерениям. При использовании разделения по измерениям можно создавать оповещения, ориентированные на ресурсы, в большом масштабе для подписки или группы ресурсов. Оповещения разбиваются на отдельные оповещения путем группирования сочетаний. Разделение столбца идентификатора ресурса Azure делает указанный ресурс целевым объектом оповещения.
Вы также можете не разделить, если требуется условие, примененное к нескольким ресурсам в области. Например, может потребоваться запустить оповещение, если в области группы ресурсов по крайней мере пять компьютеров имеют использование ЦП более 80 %.
Мониторинг нескольких ресурсов с помощью одного правила генерации оповещений
Вы можете обеспечить отслеживание в большом масштабе, применив одно правило генерации оповещений по метрике к нескольким ресурсам одного типа, которые существуют в одном регионе Azure. Для каждого отслеживаемого ресурса отправляются отдельные уведомления.
Метрики платформы для этих служб поддерживаются в следующих облаках Azure:
Service | Поставщик ресурсов | Глобальная среда Azure | Для государственных организаций | Китай |
---|---|---|---|---|
Виртуальные машины | "Microsoft.Compute/virtualMachines" | Да | Да | Да |
Базы данных SQL Server | "Microsoft.Sql/servers/database" | Да | Да | Да |
Эластичные пулы SQL Server | "Microsoft.Sql/servers/elasticpools" | Да | Да | Да |
Пулы емкости файлов NetApp | "Microsoft.NetApp/netAppAccounts/capacityPools" | Да | Да | Да |
Тома файлов NetApp | "Microsoft.NetApp/netAppAccounts/capacityPools/volumes" | Да | Да | Да |
Azure Key Vault | "Microsoft.KeyVault/vaults" | Да | Да | Да |
Кэш Azure для Redis | "Microsoft.Cache/redis" | Да | Да | Да |
Устройства Azure Stack Edge | (Для этого ресурса нет определенного поставщика ресурсов. Из-за работы устройств Stack Edge метрики извлекаются из нескольких поставщиков ресурсов. Дополнительные сведения об оповещениях для этого ресурса см. в этой документации: просмотр оповещений в Azure Stack Edge) | Да | Да | Да |
Хранилища Служб восстановления | "Microsoft.RecoveryServices/Vaults" | Да | No | No |
Гибкий сервер Базы данных Azure для PostgreSQL | "Microsoft.DBforPostgreSQL/flexibleServers" | Да | Да | Да |
Компьютеры без операционной системы (Оператор Nexus) | "Microsoft.NetworkCloud/bareMetalMachines" | Да | Да | Да |
Устройства хранения (оператор Nexus) | "Microsoft.NetworkCloud/storageAppliances" | Да | Да | Да |
Кластеры (Оператор Nexus) | "Microsoft.NetworkCloud/clusters" | Да | Да | Да |
Сетевые устройства (оператор Nexus) | Microsoft.NetworkCloud/l2Networks, Microsoft.NetworkCloud/l3Networks | Да | Да | Да |
Правила сбора данных | "Microsoft.Insights/datacollectionrules" | Да | Да | Да |
Примечание.
Оповещения метрик с несколькими ресурсами не поддерживаются для:
- Оповещений на гостевых метриках виртуальной машины.
- Оповещения на сетевых метриках виртуальных машин (суммарном входящем трафике, суммарном исходящем трафике, входящих потоках, исходящих потоках, максимальной скорости создания входящих потоков, максимальной скорости создания исходящих потоков).
Область мониторинга можно указать с помощью единого правила генерации оповещений по метрике одним из трех следующих способов. Например, с виртуальными машинами можно указать область следующим образом:
- Список виртуальных машин в одном регионе Azure в подписке.
- Все виртуальные машины в одном регионе Azure в одной или нескольких группах ресурсов в подписке.
- Все виртуальные машины в одном регионе Azure в подписке.
Применение расширенного машинного обучения с динамическими порогами
Динамические пороговые значения используют расширенное машинное обучение для:
- Узнайте об истории поведения метрик.
- Определите шаблоны и адаптируйтесь к изменениям метрик с течением времени, такими как почасовые, ежедневные или еженедельные шаблоны.
- Распознать аномалии, указывающие на возможные проблемы со службой.
- Вычислите наиболее подходящее пороговое значение для метрики.
Машинное обучение постоянно использует новые данные для получения дополнительных сведений и повышения точности порогового значения. Так как система адаптируется к поведению метрик с течением времени и оповещениям на основе отклонений от его шаблона, вам не нужно знать пороговое значение "правильно" для каждой метрики.
Динамические пороги помогут вам делать следующее:
- Создавать масштабируемые оповещения для сотен серий метрик с одним правилом генерации оповещений. Чем меньше правил генерации оповещений, тем меньше времени вы тратите на их создание и управление ими.
- Создавайте правила без необходимости знать, какое пороговое значение необходимо настроить.
- Настройте оповещения метрик с помощью высокоуровневых концепций без обширных знаний о области метрик.
- Предотвращение шумных (низких точности) или пороговых значений (низкой точности), которые не имеют ожидаемого шаблона.
- Обрабатывать шумные метрики (например, использование ЦП или памяти компьютера) и метрики с низкой дисперсией (например, уровень доступности и количество ошибок).
Подробные инструкции по использованию динамических пороговых значений см. в динамических пороговых значениях в правилах оповещений метрик.
Оповещения поиска по журналам
Правило генерации оповещений поиска по журналам отслеживает ресурс с помощью запроса Log Analytics для оценки журналов ресурсов с заданной частотой. При соблюдении условий создается оповещение. Так как вы можете использовать запросы Log Analytics, можно выполнять расширенные логические операции с данными и использовать функции KQL для обработки данных журналов.
Цель правила генерации оповещений поиска по журналам может быть:
- Отдельный ресурс, например виртуальная машина.
- Один контейнер ресурсов, например группа ресурсов или подписка.
- Несколько ресурсов, которые используют запрос по нескольким ресурсам.
Оповещения поиска по журналам могут измерять два различных способа, которые можно использовать для различных сценариев мониторинга:
- Строки таблицы: количество возвращаемых строк можно использовать для работы с такими событиями, как журналы событий Windows, системный журнал и исключения приложений.
- Вычисление числового столбца: вычисление на основе любого числового столбца, может использоваться для включения любого количества ресурсов. Примером является процент ЦП.
Можно настроить, если оповещения поиска по журналам являются отслеживанием состояния или без отслеживания состояния.
Обратите внимание, что оповещения поиска по журналам с отслеживанием состояния имеют следующие ограничения:
- Они могут активировать до 300 оповещений на оценку.
- Вы можете иметь не более 5000 оповещений с условием генерации оповещений
fired
.
Примечание.
Оповещения поиска по журналам лучше всего работают при попытке обнаружить определенные данные в журналах, а не при попытке обнаружить отсутствие данных в журналах. Так как журналы представляют собой частично структурированные данные, они не настолько открыты, как данные метрик о таких сведениях, как пакет пульса виртуальной машины. Чтобы избежать ошибок при попытке обнаружить отсутствие данных в журналах, рассмотрите возможность использования оповещений метрик. Данные можно отправлять в хранилище метрик из журналов с помощью оповещений метрик для журналов.
Мониторинг нескольких экземпляров ресурса с помощью измерений
Измерения можно использовать при создании правил генерации оповещений поиска по журналам для отслеживания значений нескольких экземпляров ресурса с одним правилом. Например, вы можете отслеживать использование ЦП на нескольких экземплярах, на которых работает веб-сайт или приложение. Каждый экземпляр отслеживается по отдельности. Уведомления отправляются для каждого экземпляра.
Мониторинг одного и того же условия для нескольких ресурсов с помощью разделения по измерениям
Чтобы отслеживать одно условие для нескольких ресурсов Azure, вы можете использовать разделение по измерениям. При использовании разделения по измерениям можно создавать оповещения, ориентированные на ресурсы, в большом масштабе для подписки или группы ресурсов. Оповещения разделены на отдельные оповещения путем группировки сочетаний с помощью числовых или строковых столбцов. Разделение по столбцу идентификатора ресурса Azure делает из указанного ресурса целевой объект оповещения.
Вы также можете не разделить, если требуется условие, примененное к нескольким ресурсам в области. Например, может потребоваться запустить оповещение, если в области группы ресурсов по крайней мере пять компьютеров имеют использование ЦП более 80 %.
Использование API для правил генерации оповещений поиска по журналам
Управление новыми правилами в рабочих областях с помощью API ScheduledQueryRules .
Примечание.
Оповещения поиска журналов для Log Analytics, используемые для управления с помощью устаревшего API оповещений Log Analytics. Узнайте больше о переключении на текущий API ScheduledQueryRules.
Оповещения поиска по журналам в счете Azure
Оповещения поиска по журналам перечислены в поставщике microsoft.insights/scheduledqueryrules
ресурсов:
- Оповещения поиска по журналам в Application Insights отображаются с точным именем ресурса, а также свойствами группы ресурсов и оповещений.
- Оповещения поиска по журналам в Log Analytics отображаются с точным именем ресурса, а также свойствами группы ресурсов и оповещений при создании с помощью API scheduledQueryRules.
- Оповещения поиска журналов, созданные из устаревшего API Log Analytics, не отслеживаются ресурсы Azure и не применяют уникальные имена ресурсов. Эти оповещения по-прежнему создаются в
microsoft.insights/scheduledqueryrules
виде скрытых ресурсов, которые имеют структуру<WorkspaceName>|<savedSearchId>|<scheduleId>|<ActionId>
именования ресурсов. Оповещения поиска по журналам в устаревшем API отображаются с указанным выше скрытым именем ресурса, а также свойствами группы ресурсов и оповещений.
Примечание.
Неподдерживаемые символы ресурсов, такие как <, >%, &, ? и /заменяются символом подчеркивания (_) в скрытых именах ресурсов. Это изменение символа также отражается в сведениях о выставлении счетов.
Оповещения журнала действий
Оповещение журнала действий отслеживает ресурс, проверяя журналы действий на наличие нового события журнала действий, соответствующего определенным условиям.
Для таких типов сценариев может потребоваться использовать оповещения журнала действий:
- При выполнении определенной операции с ресурсами в определенной группе ресурсов или подписке. Например, вам может потребоваться получать уведомления, когда:
- Виртуальная машина в рабочей группе ресурсов удаляется.
- Новые роли назначаются пользователю в подписке.
- Происходит событие работоспособности службы. События работоспособности служб включают уведомления об инцидентах и событиях обслуживания, которые применяются к ресурсам в вашей подписке.
Вы можете создать оповещение журнала действия для:
- Любой категории событий журнала действий (кроме событий оповещений).
- Любое событие журнала действий в свойстве верхнего уровня в объекте JSON.
Правила генерации оповещений журнала действий являются ресурсами Azure, поэтому их можно создать с помощью шаблона Azure Resource Manager. Их также можно создать, обновить или удалить на портале Azure.
Оповещение журнала действий отслеживает события только в той подписке, в которой создается оповещение.
Оповещения о работоспособности служб
Оповещения о работоспособности служб — это тип оповещения о действиях. Работоспособности служб позволяет узнать о сбоях, запланированных действиях обслуживания и других помощниках по работоспособности, так как проверенный интерфейс работоспособности служб знает, какие службы и ресурсы вы используете в настоящее время.
Лучший способ использовать работоспособность службы — настроить оповещения о работоспособности служб, чтобы уведомить вас с помощью предпочитаемых каналов связи при проблемах службы, плановом обслуживании или других изменениях, которые могут повлиять на используемые службы и регионы Azure.
оповещения Работоспособность ресурсов
Работоспособность ресурсов оповещения — это тип оповещения о действиях. Обзор Работоспособность ресурсов помогает диагностировать и получать поддержку проблем службы, влияющих на ресурсы Azure. Служба сообщает о текущем и прошлом состоянии ресурсов.
Для оценки состояния ресурса в службе "Работоспособность ресурсов" используются сигналы от различных служб Azure. Если ресурс неработоспособен, Работоспособность ресурсов анализирует дополнительные сведения, чтобы определить источник проблемы. Он также сообщает о действиях, которые корпорация Майкрософт принимает для устранения проблемы и определяет действия, которые можно предпринять для решения этой проблемы.
Оповещения интеллектуального обнаружения
После настройки Application Insights для проекта и приложения создается определенный объем данных, интеллектуальное обнаружение занимает 24 часа, чтобы узнать нормальное поведение приложения. Производительность вашего приложения демонстрирует типичный шаблон поведения. Некоторые запросы или вызовы зависимостей будут более подвержены сбоям, чем другие, и общая частота сбоев может увеличиться по мере увеличения нагрузки.
Интеллектуальное обнаружение использует машинное обучение для поиска этих аномалий. Интеллектуальное обнаружение отслеживает данные, полученные от приложения, и, в частности, частоту сбоев. Application Insights автоматически уведомляет вас (почти в реальном времени), если работа веб-приложения сопровождается чрезмерно частыми неудачными запросами.
По мере того как данные входят в Application Insights из веб-приложения, интеллектуальное обнаружение сравнивает текущее поведение с шаблонами, наблюдаемыми за последние несколько дней. Если по сравнению с предыдущими показателями производительности наблюдается чрезмерное увеличение частоты отказов, запускается анализ.
Чтобы помочь вам проанализировать и диагностировать проблему, в подробных сведениях о оповещении представлен анализ характеристик сбоев и связанных данных приложения. Кроме того, даются ссылки на портал Application Insights для дальнейшей диагностики. Эта функция не нуждается в настройке или настройке, так как она использует алгоритмы машинного обучения для прогнозирования нормальной частоты сбоев.
Хотя оповещения метрик говорят, что может возникнуть проблема, интеллектуальное обнаружение запускает диагностическую работу для вас. Он выполняет большую часть анализа, который вы иначе должны сделать самостоятельно. Вы получите результаты аккуратно упаковано, что помогает быстро добраться до корня проблемы.
Интеллектуальное обнаружение работает для веб-приложений, размещенных в облаке или на ваших собственных серверах, которые создают запросы к приложению или данные о зависимостях.
Оповещения Prometheus
Оповещения Prometheus используются для мониторинга метрик, хранящихся в управляемых службах Azure Monitor для Prometheus. Правила генерации оповещений Prometheus настраиваются как часть групп правил Prometheus. Они запускаются, когда результат выражения PromQL принимает значение true. Оповещения Prometheus отображаются и управляются, как и другие типы оповещений.
Следующие шаги
- Ознакомьтесь с обзором оповещений.
- Создание правила генерации оповещений.
- Дополнительные сведения об интеллектуальном обнаружении.