Поддерживаемые метрики для Microsoft.MachineLearningServices/workspaces
В следующей таблице перечислены метрики, доступные для типа ресурса Microsoft.MachineLearningServices/workspaces.
Заголовки таблиц
Метрика — отображаемое имя метрик, как оно отображается в портал Azure.
Имя в REST API — имя метрик, называемое в REST API.
Единица измерения.
Агрегирование — тип агрегирования по умолчанию. Допустимые значения: среднее, минимальное, максимальное, общее, число.
Измерения - , доступные для метрики.
Интервалы интервалов - времени, по которым выборка метрики выполняется. Например, указывает, PT1M
что метрика выборка выполняется каждую минуту, каждые 30 минут, PT30M
PT1H
каждый час и т. д.
Экспорт DS— можно ли экспортировать метрики в журналы Azure Monitor с помощью параметров диагностики.
Сведения об экспорте метрик см. в разделе " Метрики", экспортируемые с помощью правил сбора данных и создание параметров диагностики в Azure Monitor.
Сведения о хранении метрик см. в обзоре метрик Azure Monitor.
Список поддерживаемых журналов см. в разделе "Поддерживаемые категории журналов" — Microsoft.MachineLearningServices/workspaces
Категория | Метрика | Имя в REST API | Единица измерения | Агрегат | Измерения | Интервалы времени | Экспорт DS |
---|---|---|---|---|---|---|---|
Квота | Активные ядра Число активных ядер |
Active Cores |
Count | Среднее, максимальное, минимальное, общее (сумма) | Scenario , ClusterName |
PT1M | Да |
Квота | Активные узлы Число активных узлов. Это узлы, активно выполняющие задание. |
Active Nodes |
Count | Среднее, максимальное, минимальное, общее (сумма) | Scenario , ClusterName |
PT1M | Да |
Выполнить | Отмена запрошенных запусков Количество запусков, для которых была запрошена отмена для этой рабочей области. Счетчик обновляется при получении запроса на отмену выполнения. |
Cancel Requested Runs |
Count | Итог (сумма), среднее, минимальное, максимальное, число | Scenario , , RunType ComputeType PublishedPipelineId PipelineStepType ,ExperimentName |
PT1M | Да |
Выполнить | Отмененные запуски Количество запусков, отмененных для этой рабочей области. Счетчик обновляется при успешной отмене выполнения. |
Cancelled Runs |
Count | Итог (сумма), среднее, минимальное, максимальное, число | Scenario , , RunType ComputeType PublishedPipelineId PipelineStepType ,ExperimentName |
PT1M | Да |
Выполнить | Завершенные запуски Число выполнений, успешно завершенных для этой рабочей области. Значение счетчика обновляется после выполнения и сбора выходных данных. |
Completed Runs |
Count | Итог (сумма), среднее, минимальное, максимальное, число | Scenario , , RunType ComputeType PublishedPipelineId PipelineStepType ,ExperimentName |
PT1M | Да |
Ресурс | CpuCapacityMillicores Максимальная емкость узла ЦП в MilliCores. Емкость агрегируется за интервал длительностью 1 минута. |
CpuCapacityMillicores |
Count | Среднее, максимальное, минимальное, общее (сумма) | RunId , , InstanceId ComputeName |
PT1M | Да |
Ресурс | CpuMemoryCapacityMegabytes Максимальный уровень использования памяти для узла ЦП в мегабайтах. Сведения об использовании агрегируются за интервал длительностью 1 минута. |
CpuMemoryCapacityMegabytes |
Count | Среднее, максимальное, минимальное, общее (сумма) | RunId , , InstanceId ComputeName |
PT1M | Да |
Ресурс | CpuMemoryUtilizationMegabytes Уровень использования памяти для узла ЦП в мегабайтах. Сведения об использовании агрегируются за интервал длительностью 1 минута. |
CpuMemoryUtilizationMegabytes |
Count | Среднее, максимальное, минимальное, общее (сумма) | RunId , , InstanceId ComputeName |
PT1M | Да |
Ресурс | CpuMemoryUtilizationPercentage Процент использования памяти для узла ЦП. Сведения об использовании агрегируются за интервал длительностью 1 минута. |
CpuMemoryUtilizationPercentage |
Count | Среднее, максимальное, минимальное, общее (сумма) | RunId , , InstanceId ComputeName |
PT1M | Да |
Ресурс | CpuUtilization Процент использования на узле ЦП. Сведения об использовании поступают каждую минуту. |
CpuUtilization |
Count | Среднее, максимальное, минимальное, общее (сумма) | Scenario , , runId NodeId ClusterName |
PT1M | Да |
Ресурс | CpuUtilizationMillicores Сведения об использовании узла ЦП в MilliCores. Сведения об использовании агрегируются за интервал длительностью 1 минута. |
CpuUtilizationMillicores |
Count | Среднее, максимальное, минимальное, общее (сумма) | RunId , , InstanceId ComputeName |
PT1M | Да |
Ресурс | CpuUtilizationPercentage Процент использования узла ЦП. Сведения об использовании агрегируются за интервал длительностью 1 минута. |
CpuUtilizationPercentage |
Count | Среднее, максимальное, минимальное, общее (сумма) | RunId , , InstanceId ComputeName |
PT1M | Да |
Ресурс | DiskAvailMegabytes Доступное дисковое пространство, в мегабайтах. Метрики собираются с периодичностью в 1 минуту. |
DiskAvailMegabytes |
Count | Среднее, максимальное, минимальное, общее (сумма) | RunId , , InstanceId ComputeName |
PT1M | Да |
Ресурс | DiskReadMegabytes Данные считываются с диска в мегабайтах. Метрики собираются с периодичностью в 1 минуту. |
DiskReadMegabytes |
Count | Среднее, максимальное, минимальное, общее (сумма) | RunId , , InstanceId ComputeName |
PT1M | Да |
Ресурс | DiskUsedMegabytes Используемое дисковое пространство, в мегабайтах. Метрики собираются с периодичностью в 1 минуту. |
DiskUsedMegabytes |
Count | Среднее, максимальное, минимальное, общее (сумма) | RunId , , InstanceId ComputeName |
PT1M | Да |
Ресурс | DiskWriteMegabytes Данные, записанные на диск, в мегабайтах. Метрики собираются с периодичностью в 1 минуту. |
DiskWriteMegabytes |
Count | Среднее, максимальное, минимальное, общее (сумма) | RunId , , InstanceId ComputeName |
PT1M | Да |
Выполнить | ошибки Число ошибок запуска в этой рабочей области. Значение счетчика обновляется при возникновении ошибки в процессе выполнения. |
Errors |
Count | Итог (сумма), среднее, минимальное, максимальное, число | Scenario |
PT1M | Да |
Выполнить | циклы выполнения со сбоем; Количество запусков, завершившихся сбоем для этой рабочей области. Значение счетчика обновляется при сбое выполнения. |
Failed Runs |
Count | Итог (сумма), среднее, минимальное, максимальное, число | Scenario , , RunType ComputeType PublishedPipelineId PipelineStepType ,ExperimentName |
PT1M | Да |
Выполнить | Завершение выполнения Число выполнений, вошедших в состояние завершения для этой рабочей области. Значение счетчика обновляется, как выполнение уже завершено, но сбор выходных данных еще выполняется. |
Finalizing Runs |
Count | Итог (сумма), среднее, минимальное, максимальное, число | Scenario , , RunType ComputeType PublishedPipelineId PipelineStepType ,ExperimentName |
PT1M | Да |
Ресурс | GpuCapacityMilliGPUs Максимальная емкость устройства GPU в милли-GPU. Емкость агрегируется за интервал длительностью 1 минута. |
GpuCapacityMilliGPUs |
Count | Среднее, максимальное, минимальное, общее (сумма) | RunId , , InstanceId DeviceId ComputeName |
PT1M | Да |
Ресурс | Gpu NvidiaJoules Интервальное энергопотребления в джоулях на узле GPU. Сведения об энергопотреблении поступают каждую минуту. |
GpuEnergyJoules |
Count | Среднее, максимальное, минимальное, общее (сумма) | Scenario , , runId InstanceId rootRunId DeviceId ,ComputeName |
PT1M | Да |
Ресурс | GpuMemoryCapacityMegabytes Максимальный объем памяти для устройства GPU в мегабайтах. Объем памяти агрегируется каждую минуту. |
GpuMemoryCapacityMegabytes |
Count | Среднее, максимальное, минимальное, общее (сумма) | RunId , , InstanceId DeviceId ComputeName |
PT1M | Да |
Ресурс | GpuMemoryUtilization Процент использования памяти на узле GPU. Сведения об использовании поступают каждую минуту. |
GpuMemoryUtilization |
Count | Среднее, максимальное, минимальное, общее (сумма) | Scenario , , runId NodeId , DeviceId ClusterName |
PT1M | Да |
Ресурс | GpuMemoryUtilizationMegabytes Использование памяти устройством GPU в мегабайтах. Использование памяти агрегируется каждую минуту. |
GpuMemoryUtilizationMegabytes |
Count | Среднее, максимальное, минимальное, общее (сумма) | RunId , , InstanceId DeviceId ComputeName |
PT1M | Да |
Ресурс | GpuMemoryUtilizationPercentage Процент использования памяти устройством GPU. Использование памяти агрегируется каждую минуту. |
GpuMemoryUtilizationPercentage |
Count | Среднее, максимальное, минимальное, общее (сумма) | RunId , , InstanceId DeviceId ComputeName |
PT1M | Да |
Ресурс | GpuUtilization Процент использования на узле GPU. Сведения об использовании поступают каждую минуту. |
GpuUtilization |
Count | Среднее, максимальное, минимальное, общее (сумма) | Scenario , , runId NodeId , DeviceId ClusterName |
PT1M | Да |
Ресурс | GpuUtilizationMilliGPUs Использование устройства GPU в милли-GPU. Сведения об использовании агрегируются за интервал длительностью 1 минута. |
GpuUtilizationMilliGPUs |
Count | Среднее, максимальное, минимальное, общее (сумма) | RunId , , InstanceId DeviceId ComputeName |
PT1M | Да |
Ресурс | GpuUtilizationPercentage Процент использования устройства GPU. Сведения об использовании агрегируются за интервал длительностью 1 минута. |
GpuUtilizationPercentage |
Count | Среднее, максимальное, минимальное, общее (сумма) | RunId , , InstanceId DeviceId ComputeName |
PT1M | Да |
Ресурс | IBReceiveMegabytes Данные сети, полученные через InfiniBand, в мегабайтах. Метрики собираются с периодичностью в 1 минуту. |
IBReceiveMegabytes |
Count | Среднее, максимальное, минимальное, общее (сумма) | RunId , , InstanceId ComputeName DeviceId |
PT1M | Да |
Ресурс | IBTransmitMegabytes Данные сети, отправленные через InfiniBand, в мегабайтах. Метрики собираются с периодичностью в 1 минуту. |
IBTransmitMegabytes |
Count | Среднее, максимальное, минимальное, общее (сумма) | RunId , , InstanceId ComputeName DeviceId |
PT1M | Да |
Квота | Неактивные ядра Число бездействующих ядер |
Idle Cores |
Count | Среднее, максимальное, минимальное, общее (сумма) | Scenario , ClusterName |
PT1M | Да |
Квота | Неактивные узлы Количество узлов в неактивном состоянии. Узлы в неактивном состоянии — это узлы, на которых не выполняются никакие задания, но они могут принимать новые задания. |
Idle Nodes |
Count | Среднее, максимальное, минимальное, общее (сумма) | Scenario , ClusterName |
PT1M | Да |
Квота | Выход из ядер Число освобождаемых ядер |
Leaving Cores |
Count | Среднее, максимальное, минимальное, общее (сумма) | Scenario , ClusterName |
PT1M | Да |
Квота | Выход узлов Число освобождаемых узлов. Освобождаемые узлы — это узлы, которые только что завершили обработку задания и переходят в неактивное состояние. |
Leaving Nodes |
Count | Среднее, максимальное, минимальное, общее (сумма) | Scenario , ClusterName |
PT1M | Да |
Модель | Сбой развертывания модели Число развертываний моделей, завершившихся сбоем в этой рабочей области |
Model Deploy Failed |
Count | Итог (сумма), среднее, минимальное, максимальное, число | Scenario , StatusCode |
PT1M | Да |
Модель | Начало развертывания модели Число развертываний моделей, запущенных в этой рабочей области |
Model Deploy Started |
Count | Итог (сумма), среднее, минимальное, максимальное, число | Scenario |
PT1M | Да |
Модель | Успешное развертывание модели Число развертываний моделей, завершившихся успешно в этой рабочей области |
Model Deploy Succeeded |
Count | Итог (сумма), среднее, минимальное, максимальное, число | Scenario |
PT1M | Да |
Модель | Сбой регистра модели Число неудачных регистраций моделей в этой рабочей области |
Model Register Failed |
Count | Итог (сумма), среднее, минимальное, максимальное, число | Scenario , StatusCode |
PT1M | Да |
Модель | Регистрация модели выполнена успешно Число регистраций моделей, завершившихся успешно в этой рабочей области |
Model Register Succeeded |
Count | Итог (сумма), среднее, минимальное, максимальное, число | Scenario |
PT1M | Да |
Ресурс | NetworkInputMegabytes Полученные данные сети в мегабайтах. Метрики собираются с периодичностью в 1 минуту. |
NetworkInputMegabytes |
Count | Среднее, максимальное, минимальное, общее (сумма) | RunId , , InstanceId ComputeName DeviceId |
PT1M | Да |
Ресурс | NetworkOutputMegabytes Отправленные данные сети в мегабайтах. Метрики собираются с периодичностью в 1 минуту. |
NetworkOutputMegabytes |
Count | Среднее, максимальное, минимальное, общее (сумма) | RunId , , InstanceId ComputeName DeviceId |
PT1M | Да |
Выполнить | Не отвечать на запросы Число неотвечающих запусков для этой рабочей области. Значение счетчика обновляется, когда выполнение переходит в состояние "Не отвечает". |
Not Responding Runs |
Count | Итог (сумма), среднее, минимальное, максимальное, число | Scenario , , RunType ComputeType PublishedPipelineId PipelineStepType ,ExperimentName |
PT1M | Да |
Выполнить | Не запущенные запуски Число запусков в состоянии "Не запущено" для этой рабочей области. Значение счетчика обновляется при получении запроса на создание выполнения, но сведения о выполнении еще не заполнены. |
Not Started Runs |
Count | Итог (сумма), среднее, минимальное, максимальное, число | Scenario , , RunType ComputeType PublishedPipelineId PipelineStepType ,ExperimentName |
PT1M | Да |
Квота | Предварительно подготовленные ядра Количество замещенных ядер |
Preempted Cores |
Count | Среднее, максимальное, минимальное, общее (сумма) | Scenario , ClusterName |
PT1M | Да |
Квота | Предварительно подготовленные узлы Количество замещенных узлов. Это узлы с низким приоритетом, взятые из пула доступных узлов. |
Preempted Nodes |
Count | Среднее, максимальное, минимальное, общее (сумма) | Scenario , ClusterName |
PT1M | Да |
Выполнить | Подготовка запусков Число запусков, которые подготавливаются для этой рабочей области. Значение счетчиков обновляется, когда выполнение переходит в состояние подготовки во время подготовки среды выполнения. |
Preparing Runs |
Count | Итог (сумма), среднее, минимальное, максимальное, число | Scenario , , RunType ComputeType PublishedPipelineId PipelineStepType ,ExperimentName |
PT1M | Да |
Выполнить | Запуски подготовки Число запусков, которые подготавливаются для этой рабочей области. Значение счетчика обновляется, когда запуск ожидает создания или подготовки целевого объекта вычислений. |
Provisioning Runs |
Count | Итог (сумма), среднее, минимальное, максимальное, число | Scenario , , RunType ComputeType PublishedPipelineId PipelineStepType ,ExperimentName |
PT1M | Да |
Выполнить | Очереди запусков Число запусков, которые находятся в очереди для этой рабочей области. Значение счетчика обновляется, когда запуск помещается в очередь целевого объекта вычислений. Может возникнуть при ожидании готовности требуемых вычислительных узлов. |
Queued Runs |
Count | Итог (сумма), среднее, минимальное, максимальное, число | Scenario , , RunType ComputeType PublishedPipelineId PipelineStepType ,ExperimentName |
PT1M | Да |
Квота | Процент использования квоты Процент использования квоты |
Quota Utilization Percentage |
Count | Среднее, максимальное, минимальное, общее (сумма) | Scenario , , ClusterName VmFamilyName VmPriority |
PT1M | Да |
Выполнить | Запущенные запуски Число запусков в этой рабочей области. Значение счетчика обновляется, когда запуск на требуемых ресурсах начинается. |
Started Runs |
Count | Итог (сумма), среднее, минимальное, максимальное, число | Scenario , , RunType ComputeType PublishedPipelineId PipelineStepType ,ExperimentName |
PT1M | Да |
Выполнить | Запуски Количество запусков, начавшихся для этой рабочей области. Значение счетчика обновляется после запроса на создание запуска и заполнения сведений о запуске, например идентификатора запуска |
Starting Runs |
Count | Итог (сумма), среднее, минимальное, максимальное, число | Scenario , , RunType ComputeType PublishedPipelineId PipelineStepType ,ExperimentName |
PT1M | Да |
Ресурс | StorageAPIFailureCount Число сбоев вызовов API Хранилища BLOB-объектов Azure. |
StorageAPIFailureCount |
Count | Среднее, максимальное, минимальное, общее (сумма) | RunId , , InstanceId ComputeName |
PT1M | Да |
Ресурс | StorageAPISuccessCount Число успешных вызовов API Хранилища BLOB-объектов Azure. |
StorageAPISuccessCount |
Count | Среднее, максимальное, минимальное, общее (сумма) | RunId , , InstanceId ComputeName |
PT1M | Да |
Квота | Общее число ядер Общее число ядер |
Total Cores |
Count | Среднее, максимальное, минимальное, общее (сумма) | Scenario , ClusterName |
PT1M | Да |
Квота | Всего узлов Общее число узлов. Сюда входят некоторые активные узлы, бездействующие узлы, неиспользуемые узлы, замещенные узлы и освобождаемые узлы |
Total Nodes |
Count | Среднее, максимальное, минимальное, общее (сумма) | Scenario , ClusterName |
PT1M | Да |
Квота | Неиспользуемые ядра Число ядер, непригодных для использования |
Unusable Cores |
Count | Среднее, максимальное, минимальное, общее (сумма) | Scenario , ClusterName |
PT1M | Да |
Квота | Неиспользуемые узлы Число узлов, непригодных для использования. Узлы, непригодные для использования, не работают из-за неразрешимой проблемы. Azure выполнит повторный запуск этих узлов. |
Unusable Nodes |
Count | Среднее, максимальное, минимальное, общее (сумма) | Scenario , ClusterName |
PT1M | Да |
Выполнить | Предупреждения Число предупреждений запуска в этой рабочей области. Значение счетчика обновляется каждый раз, когда для запуска возникает предупреждение. |
Warnings |
Count | Итог (сумма), среднее, минимальное, максимальное, число | Scenario |
PT1M | Да |