Поддерживаемые метрики для Microsoft.MachineLearningServices/workspaces/onlineEndpoints/deployments
В следующей таблице перечислены метрики, доступные для типа ресурса Microsoft.MachineLearningServices/workspaces/onlineEndpoints/deployments.
Заголовки таблиц
Метрика — отображаемое имя метрик, как оно отображается в портал Azure.
Имя в REST API — имя метрик, называемое в REST API.
Единица измерения.
Агрегирование — тип агрегирования по умолчанию. Допустимые значения: среднее, минимальное, максимальное, общее, число.
Измерения - , доступные для метрики.
Интервалы интервалов - времени, по которым выборка метрики выполняется. Например, указывает, PT1M
что метрика выборка выполняется каждую минуту, каждые 30 минут, PT30M
PT1H
каждый час и т. д.
Экспорт DS— можно ли экспортировать метрики в журналы Azure Monitor с помощью параметров диагностики.
Сведения об экспорте метрик см. в разделе " Метрики", экспортируемые с помощью правил сбора данных и создание параметров диагностики в Azure Monitor.
Сведения о хранении метрик см. в обзоре метрик Azure Monitor.
Категория | Метрика | Имя в REST API | Единица измерения | Агрегат | Измерения | Интервалы времени | Экспорт DS |
---|---|---|---|---|---|---|---|
Ресурс | Процент использования памяти ЦП Процент использования памяти в экземпляре. Сведения об использовании поступают каждую минуту. |
CpuMemoryUtilizationPercentage |
Процент | Минимальное, максимальное, среднее | instanceId |
PT1M | Да |
Ресурс | Процент использования ЦП Процент использования ЦП на экземпляре. Сведения об использовании поступают каждую минуту. |
CpuUtilizationPercentage |
Процент | Минимальное, максимальное, среднее | instanceId |
PT1M | Да |
Ресурс | Ошибки сбора данных в минуту Количество событий сбора данных, отброшенных в минуту. |
DataCollectionErrorsPerMinute |
Count | Минимальное, максимальное, среднее | instanceId , , reason type |
PT1M | No |
Ресурс | События сбора данных в минуту Количество событий сбора данных, обрабатываемых в минуту. |
DataCollectionEventsPerMinute |
Count | Минимальное, максимальное, среднее | instanceId , type |
PT1M | No |
Ресурс | Емкость развертывания Число экземпляров в развертывании. |
DeploymentCapacity |
Count | Минимальное, максимальное, среднее | instanceId , State |
PT1M | No |
Ресурс | Использование дисков Процент использования диска в экземпляре. Сведения об использовании поступают каждую минуту. |
DiskUtilization |
Процент | Минимальное, максимальное, среднее | instanceId , disk |
PT1M | Да |
Ресурс | Энергия GPU в Joules Интервальное энергопотребления в джоулях на узле GPU. Сведения об энергопотреблении поступают каждую минуту. |
GpuEnergyJoules |
Count | Минимальное, максимальное, среднее | instanceId |
PT1M | No |
Ресурс | Процент использования памяти GPU Процент использования памяти GPU на экземпляре. Сведения об использовании поступают каждую минуту. |
GpuMemoryUtilizationPercentage |
Процент | Минимальное, максимальное, среднее | instanceId |
PT1M | Да |
Ресурс | Процент использования GPU Процент использования GPU на экземпляре. Сведения об использовании поступают каждую минуту. |
GpuUtilizationPercentage |
Процент | Минимальное, максимальное, среднее | instanceId |
PT1M | Да |
Трафик | Задержка запроса P50 Средняя задержка запроса P50, агрегированная по всем значениям задержки запроса, собранным за выбранный период времени |
RequestLatency_P50 |
Миллисекунды | По средней | <none> | PT1M | Да |
Трафик | Задержка запроса P90 Средняя задержка запроса P90, агрегированная по всем значениям задержки запроса, собранным за выбранный период времени |
RequestLatency_P90 |
Миллисекунды | По средней | <none> | PT1M | Да |
Трафик | Задержка запроса P95 Средняя задержка запроса P95, агрегированная по всем значениям задержки запроса, собранным за выбранный период времени |
RequestLatency_P95 |
Миллисекунды | По средней | <none> | PT1M | Да |
Трафик | Задержка запроса P99 Средняя задержка запроса P99, агрегированная по всем значениям задержки запроса, собранным за выбранный период времени |
RequestLatency_P99 |
Миллисекунды | По средней | <none> | PT1M | Да |
Трафик | Запросы в минуту Количество запросов, отправленных в интернет-развертывание в течение минуты |
RequestsPerMinute |
Count | По средней | envoy_response_code |
PT1M | No |