Поделиться через


Поддерживаемые метрики для Microsoft.MachineLearningServices/workspaces/onlineEndpoints/deployments

В следующей таблице перечислены метрики, доступные для типа ресурса Microsoft.MachineLearningServices/workspaces/onlineEndpoints/deployments.

Заголовки таблиц

Метрика — отображаемое имя метрик, как оно отображается в портал Azure.
Имя в REST API — имя метрик, называемое в REST API.
Единица измерения.
Агрегирование — тип агрегирования по умолчанию. Допустимые значения: среднее, минимальное, максимальное, общее, число.
Измерения - , доступные для метрики.
Интервалы интервалов - времени, по которым выборка метрики выполняется. Например, указывает, PT1M что метрика выборка выполняется каждую минуту, каждые 30 минут, PT30M PT1H каждый час и т. д.
Экспорт DS— можно ли экспортировать метрики в журналы Azure Monitor с помощью параметров диагностики.

Сведения об экспорте метрик см. в разделе " Метрики", экспортируемые с помощью правил сбора данных и создание параметров диагностики в Azure Monitor.

Сведения о хранении метрик см. в обзоре метрик Azure Monitor.

Категория Метрика Имя в REST API Единица измерения Агрегат Измерения Интервалы времени Экспорт DS
Ресурс Процент использования памяти ЦП

Процент использования памяти в экземпляре. Сведения об использовании поступают каждую минуту.
CpuMemoryUtilizationPercentage Процент Минимальное, максимальное, среднее instanceId PT1M Да
Ресурс Процент использования ЦП

Процент использования ЦП на экземпляре. Сведения об использовании поступают каждую минуту.
CpuUtilizationPercentage Процент Минимальное, максимальное, среднее instanceId PT1M Да
Ресурс Ошибки сбора данных в минуту

Количество событий сбора данных, отброшенных в минуту.
DataCollectionErrorsPerMinute Count Минимальное, максимальное, среднее instanceId, , reasontype PT1M No
Ресурс События сбора данных в минуту

Количество событий сбора данных, обрабатываемых в минуту.
DataCollectionEventsPerMinute Count Минимальное, максимальное, среднее instanceId, type PT1M No
Ресурс Емкость развертывания

Число экземпляров в развертывании.
DeploymentCapacity Count Минимальное, максимальное, среднее instanceId, State PT1M No
Ресурс Использование дисков

Процент использования диска в экземпляре. Сведения об использовании поступают каждую минуту.
DiskUtilization Процент Минимальное, максимальное, среднее instanceId, disk PT1M Да
Ресурс Энергия GPU в Joules

Интервальное энергопотребления в джоулях на узле GPU. Сведения об энергопотреблении поступают каждую минуту.
GpuEnergyJoules Count Минимальное, максимальное, среднее instanceId PT1M No
Ресурс Процент использования памяти GPU

Процент использования памяти GPU на экземпляре. Сведения об использовании поступают каждую минуту.
GpuMemoryUtilizationPercentage Процент Минимальное, максимальное, среднее instanceId PT1M Да
Ресурс Процент использования GPU

Процент использования GPU на экземпляре. Сведения об использовании поступают каждую минуту.
GpuUtilizationPercentage Процент Минимальное, максимальное, среднее instanceId PT1M Да
Трафик Задержка запроса P50

Средняя задержка запроса P50, агрегированная по всем значениям задержки запроса, собранным за выбранный период времени
RequestLatency_P50 Миллисекунды По средней <none> PT1M Да
Трафик Задержка запроса P90

Средняя задержка запроса P90, агрегированная по всем значениям задержки запроса, собранным за выбранный период времени
RequestLatency_P90 Миллисекунды По средней <none> PT1M Да
Трафик Задержка запроса P95

Средняя задержка запроса P95, агрегированная по всем значениям задержки запроса, собранным за выбранный период времени
RequestLatency_P95 Миллисекунды По средней <none> PT1M Да
Трафик Задержка запроса P99

Средняя задержка запроса P99, агрегированная по всем значениям задержки запроса, собранным за выбранный период времени
RequestLatency_P99 Миллисекунды По средней <none> PT1M Да
Трафик Запросы в минуту

Количество запросов, отправленных в интернет-развертывание в течение минуты
RequestsPerMinute Count По средней envoy_response_code PT1M No

Следующие шаги