Поделиться через


Поддерживаемые метрики для Microsoft.MachineLearningServices/workspaces

В следующей таблице перечислены метрики, доступные для типа ресурса Microsoft.MachineLearningServices/workspaces.

Заголовки таблиц

Метрика — отображаемое имя метрик, как оно отображается в портал Azure.
Имя в REST API — имя метрик, называемое в REST API.
Единица измерения.
Агрегирование — тип агрегирования по умолчанию. Допустимые значения: среднее, минимальное, максимальное, общее, число.
Измерения - , доступные для метрики.
Интервалы интервалов - времени, по которым выборка метрики выполняется. Например, указывает, PT1M что метрика выборка выполняется каждую минуту, каждые 30 минут, PT30M PT1H каждый час и т. д.
Экспорт DS— можно ли экспортировать метрики в журналы Azure Monitor с помощью параметров диагностики.

Сведения об экспорте метрик см. в разделе " Метрики", экспортируемые с помощью правил сбора данных и создание параметров диагностики в Azure Monitor.

Сведения о хранении метрик см. в обзоре метрик Azure Monitor.

Список поддерживаемых журналов см. в разделе "Поддерживаемые категории журналов" — Microsoft.MachineLearningServices/workspaces

Категория Метрика Имя в REST API Единица измерения Агрегат Измерения Интервалы времени Экспорт DS
Квота Активные ядра

Число активных ядер
Active Cores Count Среднее, максимальное, минимальное, общее (сумма) Scenario, ClusterName PT1M Да
Квота Активные узлы

Число активных узлов. Это узлы, активно выполняющие задание.
Active Nodes Count Среднее, максимальное, минимальное, общее (сумма) Scenario, ClusterName PT1M Да
Выполнить Отмена запрошенных запусков

Количество запусков, для которых была запрошена отмена для этой рабочей области. Счетчик обновляется при получении запроса на отмену выполнения.
Cancel Requested Runs Count Итог (сумма), среднее, минимальное, максимальное, число Scenario, , RunTypeComputeTypePublishedPipelineIdPipelineStepType,ExperimentName PT1M Да
Выполнить Отмененные запуски

Количество запусков, отмененных для этой рабочей области. Счетчик обновляется при успешной отмене выполнения.
Cancelled Runs Count Итог (сумма), среднее, минимальное, максимальное, число Scenario, , RunTypeComputeTypePublishedPipelineIdPipelineStepType,ExperimentName PT1M Да
Выполнить Завершенные запуски

Число выполнений, успешно завершенных для этой рабочей области. Значение счетчика обновляется после выполнения и сбора выходных данных.
Completed Runs Count Итог (сумма), среднее, минимальное, максимальное, число Scenario, , RunTypeComputeTypePublishedPipelineIdPipelineStepType,ExperimentName PT1M Да
Ресурс CpuCapacityMillicores

Максимальная емкость узла ЦП в MilliCores. Емкость агрегируется за интервал длительностью 1 минута.
CpuCapacityMillicores Count Среднее, максимальное, минимальное, общее (сумма) RunId, , InstanceIdComputeName PT1M Да
Ресурс CpuMemoryCapacityMegabytes

Максимальный уровень использования памяти для узла ЦП в мегабайтах. Сведения об использовании агрегируются за интервал длительностью 1 минута.
CpuMemoryCapacityMegabytes Count Среднее, максимальное, минимальное, общее (сумма) RunId, , InstanceIdComputeName PT1M Да
Ресурс CpuMemoryUtilizationMegabytes

Уровень использования памяти для узла ЦП в мегабайтах. Сведения об использовании агрегируются за интервал длительностью 1 минута.
CpuMemoryUtilizationMegabytes Count Среднее, максимальное, минимальное, общее (сумма) RunId, , InstanceIdComputeName PT1M Да
Ресурс CpuMemoryUtilizationPercentage

Процент использования памяти для узла ЦП. Сведения об использовании агрегируются за интервал длительностью 1 минута.
CpuMemoryUtilizationPercentage Count Среднее, максимальное, минимальное, общее (сумма) RunId, , InstanceIdComputeName PT1M Да
Ресурс CpuUtilization

Процент использования на узле ЦП. Сведения об использовании поступают каждую минуту.
CpuUtilization Count Среднее, максимальное, минимальное, общее (сумма) Scenario, , runIdNodeIdClusterName PT1M Да
Ресурс CpuUtilizationMillicores

Сведения об использовании узла ЦП в MilliCores. Сведения об использовании агрегируются за интервал длительностью 1 минута.
CpuUtilizationMillicores Count Среднее, максимальное, минимальное, общее (сумма) RunId, , InstanceIdComputeName PT1M Да
Ресурс CpuUtilizationPercentage

Процент использования узла ЦП. Сведения об использовании агрегируются за интервал длительностью 1 минута.
CpuUtilizationPercentage Count Среднее, максимальное, минимальное, общее (сумма) RunId, , InstanceIdComputeName PT1M Да
Ресурс DiskAvailMegabytes

Доступное дисковое пространство, в мегабайтах. Метрики собираются с периодичностью в 1 минуту.
DiskAvailMegabytes Count Среднее, максимальное, минимальное, общее (сумма) RunId, , InstanceIdComputeName PT1M Да
Ресурс DiskReadMegabytes

Данные считываются с диска в мегабайтах. Метрики собираются с периодичностью в 1 минуту.
DiskReadMegabytes Count Среднее, максимальное, минимальное, общее (сумма) RunId, , InstanceIdComputeName PT1M Да
Ресурс DiskUsedMegabytes

Используемое дисковое пространство, в мегабайтах. Метрики собираются с периодичностью в 1 минуту.
DiskUsedMegabytes Count Среднее, максимальное, минимальное, общее (сумма) RunId, , InstanceIdComputeName PT1M Да
Ресурс DiskWriteMegabytes

Данные, записанные на диск, в мегабайтах. Метрики собираются с периодичностью в 1 минуту.
DiskWriteMegabytes Count Среднее, максимальное, минимальное, общее (сумма) RunId, , InstanceIdComputeName PT1M Да
Выполнить ошибки

Число ошибок запуска в этой рабочей области. Значение счетчика обновляется при возникновении ошибки в процессе выполнения.
Errors Count Итог (сумма), среднее, минимальное, максимальное, число Scenario PT1M Да
Выполнить циклы выполнения со сбоем;

Количество запусков, завершившихся сбоем для этой рабочей области. Значение счетчика обновляется при сбое выполнения.
Failed Runs Count Итог (сумма), среднее, минимальное, максимальное, число Scenario, , RunTypeComputeTypePublishedPipelineIdPipelineStepType,ExperimentName PT1M Да
Выполнить Завершение выполнения

Число выполнений, вошедших в состояние завершения для этой рабочей области. Значение счетчика обновляется, как выполнение уже завершено, но сбор выходных данных еще выполняется.
Finalizing Runs Count Итог (сумма), среднее, минимальное, максимальное, число Scenario, , RunTypeComputeTypePublishedPipelineIdPipelineStepType,ExperimentName PT1M Да
Ресурс GpuCapacityMilliGPUs

Максимальная емкость устройства GPU в милли-GPU. Емкость агрегируется за интервал длительностью 1 минута.
GpuCapacityMilliGPUs Count Среднее, максимальное, минимальное, общее (сумма) RunId, , InstanceIdDeviceIdComputeName PT1M Да
Ресурс Gpu NvidiaJoules

Интервальное энергопотребления в джоулях на узле GPU. Сведения об энергопотреблении поступают каждую минуту.
GpuEnergyJoules Count Среднее, максимальное, минимальное, общее (сумма) Scenario, , runIdInstanceIdrootRunIdDeviceId,ComputeName PT1M Да
Ресурс GpuMemoryCapacityMegabytes

Максимальный объем памяти для устройства GPU в мегабайтах. Объем памяти агрегируется каждую минуту.
GpuMemoryCapacityMegabytes Count Среднее, максимальное, минимальное, общее (сумма) RunId, , InstanceIdDeviceIdComputeName PT1M Да
Ресурс GpuMemoryUtilization

Процент использования памяти на узле GPU. Сведения об использовании поступают каждую минуту.
GpuMemoryUtilization Count Среднее, максимальное, минимальное, общее (сумма) Scenario, , runIdNodeId, DeviceIdClusterName PT1M Да
Ресурс GpuMemoryUtilizationMegabytes

Использование памяти устройством GPU в мегабайтах. Использование памяти агрегируется каждую минуту.
GpuMemoryUtilizationMegabytes Count Среднее, максимальное, минимальное, общее (сумма) RunId, , InstanceIdDeviceIdComputeName PT1M Да
Ресурс GpuMemoryUtilizationPercentage

Процент использования памяти устройством GPU. Использование памяти агрегируется каждую минуту.
GpuMemoryUtilizationPercentage Count Среднее, максимальное, минимальное, общее (сумма) RunId, , InstanceIdDeviceIdComputeName PT1M Да
Ресурс GpuUtilization

Процент использования на узле GPU. Сведения об использовании поступают каждую минуту.
GpuUtilization Count Среднее, максимальное, минимальное, общее (сумма) Scenario, , runIdNodeId, DeviceIdClusterName PT1M Да
Ресурс GpuUtilizationMilliGPUs

Использование устройства GPU в милли-GPU. Сведения об использовании агрегируются за интервал длительностью 1 минута.
GpuUtilizationMilliGPUs Count Среднее, максимальное, минимальное, общее (сумма) RunId, , InstanceIdDeviceIdComputeName PT1M Да
Ресурс GpuUtilizationPercentage

Процент использования устройства GPU. Сведения об использовании агрегируются за интервал длительностью 1 минута.
GpuUtilizationPercentage Count Среднее, максимальное, минимальное, общее (сумма) RunId, , InstanceIdDeviceIdComputeName PT1M Да
Ресурс IBReceiveMegabytes

Данные сети, полученные через InfiniBand, в мегабайтах. Метрики собираются с периодичностью в 1 минуту.
IBReceiveMegabytes Count Среднее, максимальное, минимальное, общее (сумма) RunId, , InstanceIdComputeNameDeviceId PT1M Да
Ресурс IBTransmitMegabytes

Данные сети, отправленные через InfiniBand, в мегабайтах. Метрики собираются с периодичностью в 1 минуту.
IBTransmitMegabytes Count Среднее, максимальное, минимальное, общее (сумма) RunId, , InstanceIdComputeNameDeviceId PT1M Да
Квота Неактивные ядра

Число бездействующих ядер
Idle Cores Count Среднее, максимальное, минимальное, общее (сумма) Scenario, ClusterName PT1M Да
Квота Неактивные узлы

Количество узлов в неактивном состоянии. Узлы в неактивном состоянии — это узлы, на которых не выполняются никакие задания, но они могут принимать новые задания.
Idle Nodes Count Среднее, максимальное, минимальное, общее (сумма) Scenario, ClusterName PT1M Да
Квота Выход из ядер

Число освобождаемых ядер
Leaving Cores Count Среднее, максимальное, минимальное, общее (сумма) Scenario, ClusterName PT1M Да
Квота Выход узлов

Число освобождаемых узлов. Освобождаемые узлы — это узлы, которые только что завершили обработку задания и переходят в неактивное состояние.
Leaving Nodes Count Среднее, максимальное, минимальное, общее (сумма) Scenario, ClusterName PT1M Да
Модель Сбой развертывания модели

Число развертываний моделей, завершившихся сбоем в этой рабочей области
Model Deploy Failed Count Итог (сумма), среднее, минимальное, максимальное, число Scenario, StatusCode PT1M Да
Модель Начало развертывания модели

Число развертываний моделей, запущенных в этой рабочей области
Model Deploy Started Count Итог (сумма), среднее, минимальное, максимальное, число Scenario PT1M Да
Модель Успешное развертывание модели

Число развертываний моделей, завершившихся успешно в этой рабочей области
Model Deploy Succeeded Count Итог (сумма), среднее, минимальное, максимальное, число Scenario PT1M Да
Модель Сбой регистра модели

Число неудачных регистраций моделей в этой рабочей области
Model Register Failed Count Итог (сумма), среднее, минимальное, максимальное, число Scenario, StatusCode PT1M Да
Модель Регистрация модели выполнена успешно

Число регистраций моделей, завершившихся успешно в этой рабочей области
Model Register Succeeded Count Итог (сумма), среднее, минимальное, максимальное, число Scenario PT1M Да
Ресурс NetworkInputMegabytes

Полученные данные сети в мегабайтах. Метрики собираются с периодичностью в 1 минуту.
NetworkInputMegabytes Count Среднее, максимальное, минимальное, общее (сумма) RunId, , InstanceIdComputeNameDeviceId PT1M Да
Ресурс NetworkOutputMegabytes

Отправленные данные сети в мегабайтах. Метрики собираются с периодичностью в 1 минуту.
NetworkOutputMegabytes Count Среднее, максимальное, минимальное, общее (сумма) RunId, , InstanceIdComputeNameDeviceId PT1M Да
Выполнить Не отвечать на запросы

Число неотвечающих запусков для этой рабочей области. Значение счетчика обновляется, когда выполнение переходит в состояние "Не отвечает".
Not Responding Runs Count Итог (сумма), среднее, минимальное, максимальное, число Scenario, , RunTypeComputeTypePublishedPipelineIdPipelineStepType,ExperimentName PT1M Да
Выполнить Не запущенные запуски

Число запусков в состоянии "Не запущено" для этой рабочей области. Значение счетчика обновляется при получении запроса на создание выполнения, но сведения о выполнении еще не заполнены.
Not Started Runs Count Итог (сумма), среднее, минимальное, максимальное, число Scenario, , RunTypeComputeTypePublishedPipelineIdPipelineStepType,ExperimentName PT1M Да
Квота Предварительно подготовленные ядра

Количество замещенных ядер
Preempted Cores Count Среднее, максимальное, минимальное, общее (сумма) Scenario, ClusterName PT1M Да
Квота Предварительно подготовленные узлы

Количество замещенных узлов. Это узлы с низким приоритетом, взятые из пула доступных узлов.
Preempted Nodes Count Среднее, максимальное, минимальное, общее (сумма) Scenario, ClusterName PT1M Да
Выполнить Подготовка запусков

Число запусков, которые подготавливаются для этой рабочей области. Значение счетчиков обновляется, когда выполнение переходит в состояние подготовки во время подготовки среды выполнения.
Preparing Runs Count Итог (сумма), среднее, минимальное, максимальное, число Scenario, , RunTypeComputeTypePublishedPipelineIdPipelineStepType,ExperimentName PT1M Да
Выполнить Запуски подготовки

Число запусков, которые подготавливаются для этой рабочей области. Значение счетчика обновляется, когда запуск ожидает создания или подготовки целевого объекта вычислений.
Provisioning Runs Count Итог (сумма), среднее, минимальное, максимальное, число Scenario, , RunTypeComputeTypePublishedPipelineIdPipelineStepType,ExperimentName PT1M Да
Выполнить Очереди запусков

Число запусков, которые находятся в очереди для этой рабочей области. Значение счетчика обновляется, когда запуск помещается в очередь целевого объекта вычислений. Может возникнуть при ожидании готовности требуемых вычислительных узлов.
Queued Runs Count Итог (сумма), среднее, минимальное, максимальное, число Scenario, , RunTypeComputeTypePublishedPipelineIdPipelineStepType,ExperimentName PT1M Да
Квота Процент использования квоты

Процент использования квоты
Quota Utilization Percentage Count Среднее, максимальное, минимальное, общее (сумма) Scenario, , ClusterNameVmFamilyNameVmPriority PT1M Да
Выполнить Запущенные запуски

Число запусков в этой рабочей области. Значение счетчика обновляется, когда запуск на требуемых ресурсах начинается.
Started Runs Count Итог (сумма), среднее, минимальное, максимальное, число Scenario, , RunTypeComputeTypePublishedPipelineIdPipelineStepType,ExperimentName PT1M Да
Выполнить Запуски

Количество запусков, начавшихся для этой рабочей области. Значение счетчика обновляется после запроса на создание запуска и заполнения сведений о запуске, например идентификатора запуска
Starting Runs Count Итог (сумма), среднее, минимальное, максимальное, число Scenario, , RunTypeComputeTypePublishedPipelineIdPipelineStepType,ExperimentName PT1M Да
Ресурс StorageAPIFailureCount

Число сбоев вызовов API Хранилища BLOB-объектов Azure.
StorageAPIFailureCount Count Среднее, максимальное, минимальное, общее (сумма) RunId, , InstanceIdComputeName PT1M Да
Ресурс StorageAPISuccessCount

Число успешных вызовов API Хранилища BLOB-объектов Azure.
StorageAPISuccessCount Count Среднее, максимальное, минимальное, общее (сумма) RunId, , InstanceIdComputeName PT1M Да
Квота Общее число ядер

Общее число ядер
Total Cores Count Среднее, максимальное, минимальное, общее (сумма) Scenario, ClusterName PT1M Да
Квота Всего узлов

Общее число узлов. Сюда входят некоторые активные узлы, бездействующие узлы, неиспользуемые узлы, замещенные узлы и освобождаемые узлы
Total Nodes Count Среднее, максимальное, минимальное, общее (сумма) Scenario, ClusterName PT1M Да
Квота Неиспользуемые ядра

Число ядер, непригодных для использования
Unusable Cores Count Среднее, максимальное, минимальное, общее (сумма) Scenario, ClusterName PT1M Да
Квота Неиспользуемые узлы

Число узлов, непригодных для использования. Узлы, непригодные для использования, не работают из-за неразрешимой проблемы. Azure выполнит повторный запуск этих узлов.
Unusable Nodes Count Среднее, максимальное, минимальное, общее (сумма) Scenario, ClusterName PT1M Да
Выполнить Предупреждения

Число предупреждений запуска в этой рабочей области. Значение счетчика обновляется каждый раз, когда для запуска возникает предупреждение.
Warnings Count Итог (сумма), среднее, минимальное, максимальное, число Scenario PT1M Да

Следующие шаги