你当前正在访问 Microsoft Azure Global Edition 技术文档网站。 如果需要访问由世纪互联运营的 Microsoft Azure 中国技术文档网站,请访问 https://docs.azure.cn

Microsoft.MachineLearningServices/workspaces 支持的指标

下表列出了可用于 Microsoft.MachineLearningServices/workspaces 资源类型的指标。

表标题

指标 - 在 Azure 门户中显示的指标显示名称。
Rest API 中的名称 - 在 REST API 中引用的指标名称。
单位 - 度量单位。
聚合 - 默认的聚合类型。 有效值:平均值、最小值、最大值、总计、计数。
维度 - 适用于指标的维度
时间粒度 - 对指标采样的间隔。 例如,PT1M 表示该指标每分钟采样一次,PT30M 表示每 30 分钟一次,PT1H 表示每小时一次,以此类推。
DS 导出 - 是否可通过诊断设置将指标导出到 Azure Monitor 日志。

有关导出指标的信息,请参阅 - 使用数据收集规则 导出指标并在 Azure Monitor 中创建诊断设置。

有关指标保留的信息,请参阅 Azure Monitor 指标概述

有关支持的日志列表,请参阅支持的日志类别 - Microsoft.MachineLearningServices/workspaces

类别:模型

指标 REST API 中的名称 Unit 聚合 维度 时间粒度 DS 导出
失败的模型部署数

此工作区中失败的模型部署数
Model Deploy Failed 计数 总计(总和)、平均值、最小值、最大值、计数 Scenario, StatusCode PT1M
已启动的模型部署数

此工作区中已启动的模型部署数
Model Deploy Started 计数 总计(总和)、平均值、最小值、最大值、计数 Scenario PT1M
成功的模型部署数

此工作区中成功的模型部署数
Model Deploy Succeeded 计数 总计(总和)、平均值、最小值、最大值、计数 Scenario PT1M
失败的模型注册数

此工作区中失败的模型注册数
Model Register Failed 计数 总计(总和)、平均值、最小值、最大值、计数 Scenario, StatusCode PT1M
成功的模型注册数

此工作区中成功的模型注册数
Model Register Succeeded 计数 总计(总和)、平均值、最小值、最大值、计数 Scenario PT1M

类别:配额

指标 REST API 中的名称 Unit 聚合 维度 时间粒度 DS 导出
活动核心数

活动核心数
Active Cores 计数 平均值、最大值、最小值、总计(总和) Scenario, ClusterName PT1M
活动节点数

活动节点数。 这些节点是正在运行作业的节点。
Active Nodes 计数 平均值、最大值、最小值、总计(总和) Scenario, ClusterName PT1M
空闲核心数

空闲核心数
Idle Cores 计数 平均值、最大值、最小值、总计(总和) Scenario, ClusterName PT1M
空闲节点数

空闲节点数。 空闲节点是指未运行任何作业,但可以接受新作业(如果可用)的节点。
Idle Nodes 计数 平均值、最大值、最小值、总计(总和) Scenario, ClusterName PT1M
正在退出的核心数

正在退出的核心数
Leaving Cores 计数 平均值、最大值、最小值、总计(总和) Scenario, ClusterName PT1M
正在退出的节点数

正在退出的节点数。 正在退出的节点是指刚刚完成了作业处理,将进入空闲状态的节点。
Leaving Nodes 计数 平均值、最大值、最小值、总计(总和) Scenario, ClusterName PT1M
占用的核心数

占用的核心数
Preempted Cores 计数 平均值、最大值、最小值、总计(总和) Scenario, ClusterName PT1M
占用的节点数

占用的节点数。 这些节点是已从可用节点池中取出的低优先级节点。
Preempted Nodes 计数 平均值、最大值、最小值、总计(总和) Scenario, ClusterName PT1M
配额利用率百分比

已利用的配额百分比
Quota Utilization Percentage 计数 平均值、最大值、最小值、总计(总和) Scenario、、ClusterNameVmFamilyName、、VmPriority PT1M
核心总数

核心总数
Total Cores 计数 平均值、最大值、最小值、总计(总和) Scenario, ClusterName PT1M
节点总数

节点总数。 此总数包括一些活动节点、空闲节点、不可用的节点、占用的节点和正在退出的节点
Total Nodes 计数 平均值、最大值、最小值、总计(总和) Scenario, ClusterName PT1M
不可用的核心数

不可用的核心数
Unusable Cores 计数 平均值、最大值、最小值、总计(总和) Scenario, ClusterName PT1M
不可用的节点数

不可用的节点数。 不可用的节点是由于存在某种不可解决的问题而无法正常运行的节点。 Azure 将回收这些节点。
Unusable Nodes 计数 平均值、最大值、最小值、总计(总和) Scenario, ClusterName PT1M

类别:资源

指标 REST API 中的名称 Unit 聚合 维度 时间粒度 DS 导出
CpuCapacityMillicores

CPU 节点的最大容量(以毫核为单位)。 容量每分钟聚合一次。
CpuCapacityMillicores 计数 平均值、最大值、最小值、总计(总和) RunIdInstanceId、、 ComputeName PT1M
CpuMemoryCapacityMegabytes

CPU 节点的最大内存利用率(以 MB 为单位)。 利用率每分钟聚合一次。
CpuMemoryCapacityMegabytes 计数 平均值、最大值、最小值、总计(总和) RunIdInstanceId、、 ComputeName PT1M
CpuMemoryUtilizationMegabytes

CPU 节点的内存利用率(以 MB 为单位)。 利用率每分钟聚合一次。
CpuMemoryUtilizationMegabytes 计数 平均值、最大值、最小值、总计(总和) RunIdInstanceId、、 ComputeName PT1M
CpuMemoryUtilizationPercentage

CPU 节点的内存利用率百分比。 利用率每分钟聚合一次。
CpuMemoryUtilizationPercentage 计数 平均值、最大值、最小值、总计(总和) RunIdInstanceId、、 ComputeName PT1M
CpuUtilization

CPU 节点上的使用率百分比。 利用率每分钟报告一次。
CpuUtilization 计数 平均值、最大值、最小值、总计(总和) Scenario、、runIdNodeId、、ClusterName PT1M
CpuUtilizationMillicores

CPU 节点的利用率(以毫核为单位)。 利用率每分钟聚合一次。
CpuUtilizationMillicores 计数 平均值、最大值、最小值、总计(总和) RunIdInstanceId、、 ComputeName PT1M
CpuUtilizationPercentage

CPU 节点的利用率百分比。 利用率每分钟聚合一次。
CpuUtilizationPercentage 计数 平均值、最大值、最小值、总计(总和) RunIdInstanceId、、 ComputeName PT1M
DiskAvailMegabytes

可用磁盘空间(以 MB 为单位)。 指标按一分钟的时间间隔进行聚合。
DiskAvailMegabytes 计数 平均值、最大值、最小值、总计(总和) RunIdInstanceId、、 ComputeName PT1M
DiskReadMegabytes

从磁盘读取的数据(以 MB 为单位)。 指标按一分钟的时间间隔进行聚合。
DiskReadMegabytes 计数 平均值、最大值、最小值、总计(总和) RunIdInstanceId、、 ComputeName PT1M
DiskUsedMegabytes

已用磁盘空间(以 MB 为单位)。 指标按一分钟的时间间隔进行聚合。
DiskUsedMegabytes 计数 平均值、最大值、最小值、总计(总和) RunIdInstanceId、、 ComputeName PT1M
DiskWriteMegabytes

写入磁盘的数据(以 MB 为单位)。 指标按一分钟的时间间隔进行聚合。
DiskWriteMegabytes 计数 平均值、最大值、最小值、总计(总和) RunIdInstanceId、、 ComputeName PT1M
GpuCapacityMilliGPUs

GPU 设备的最大容量(以毫 GPU 为单位)。 容量每分钟聚合一次。
GpuCapacityMilliGPUs 计数 平均值、最大值、最小值、总计(总和) RunId、、InstanceIdDeviceId、、ComputeName PT1M
GpuEnergyJoules

GPU 节点上的间隔功耗(焦耳)。 功耗每分钟报告一次。
GpuEnergyJoules 计数 平均值、最大值、最小值、总计(总和) Scenario、、runIdrootRunIdInstanceIdDeviceIdComputeName PT1M
GpuMemoryCapacityMegabytes

GPU 设备的最大内存容量(以兆字节为单位)。 容量每分钟聚合一次。
GpuMemoryCapacityMegabytes 计数 平均值、最大值、最小值、总计(总和) RunId、、InstanceIdDeviceId、、ComputeName PT1M
GpuMemoryUtilization

GPU 节点上内存利用率的百分比。 利用率每分钟报告一次。
GpuMemoryUtilization 计数 平均值、最大值、最小值、总计(总和) Scenario、、runIdNodeIdDeviceIdClusterName PT1M
GpuMemoryUtilizationMegabytes

GPU 设备的内存利用率(以兆字节为单位)。 利用率每分钟聚合一次。
GpuMemoryUtilizationMegabytes 计数 平均值、最大值、最小值、总计(总和) RunId、、InstanceIdDeviceId、、ComputeName PT1M
GpuMemoryUtilizationPercentage

GPU 设备的内存利用率百分比。 利用率每分钟聚合一次。
GpuMemoryUtilizationPercentage 计数 平均值、最大值、最小值、总计(总和) RunId、、InstanceIdDeviceId、、ComputeName PT1M
GpuUtilization

GPU 节点上的使用率百分比。 利用率每分钟报告一次。
GpuUtilization 计数 平均值、最大值、最小值、总计(总和) Scenario、、runIdNodeIdDeviceIdClusterName PT1M
GpuUtilizationMilliGPUs

GPU 设备利用率(以毫 GPU 为单位)。 利用率每分钟聚合一次。
GpuUtilizationMilliGPUs 计数 平均值、最大值、最小值、总计(总和) RunId、、InstanceIdDeviceId、、ComputeName PT1M
GpuUtilizationPercentage

GPU 设备的利用率百分比。 利用率每分钟聚合一次。
GpuUtilizationPercentage 计数 平均值、最大值、最小值、总计(总和) RunId、、InstanceIdDeviceId、、ComputeName PT1M
IBReceiveMegabytes

通过 InfiniBand 接收的网络数据(以兆字节为单位)。 指标按一分钟的时间间隔进行聚合。
IBReceiveMegabytes 计数 平均值、最大值、最小值、总计(总和) RunId、、InstanceIdComputeName、、DeviceId PT1M
IBTransmitMegabytes

通过 InfiniBand 发送的网络数据(以兆字节为单位)。 指标按一分钟的时间间隔进行聚合。
IBTransmitMegabytes 计数 平均值、最大值、最小值、总计(总和) RunId、、InstanceIdComputeName、、DeviceId PT1M
NetworkInputMegabytes

接收的网络数据(以兆字节为单位)。 指标按一分钟的时间间隔进行聚合。
NetworkInputMegabytes 计数 平均值、最大值、最小值、总计(总和) RunId、、InstanceIdComputeName、、DeviceId PT1M
NetworkOutputMegabytes

发送的网络数据(以兆字节为单位)。 指标按一分钟的时间间隔进行聚合。
NetworkOutputMegabytes 计数 平均值、最大值、最小值、总计(总和) RunId、、InstanceIdComputeName、、DeviceId PT1M
StorageAPIFailureCount

Azure Blob 存储 API 调用失败计数。
StorageAPIFailureCount 计数 平均值、最大值、最小值、总计(总和) RunIdInstanceId、、 ComputeName PT1M
StorageAPISuccessCount

Azure Blob 存储 API 调用成功计数。
StorageAPISuccessCount 计数 平均值、最大值、最小值、总计(总和) RunIdInstanceId、、 ComputeName PT1M

类别:运行

指标 REST API 中的名称 Unit 聚合 维度 时间粒度 DS 导出
请求取消运行数

此工作区请求取消的运行数。 当收到用于运行的取消请求时,将更新计数。
Cancel Requested Runs 计数 总计(总和)、平均值、最小值、最大值、计数 Scenario、、RunTypePublishedPipelineIdComputeTypePipelineStepTypeExperimentName PT1M
已取消运行数

此工作区取消的运行数。 成功取消运行时,将更新计数。
Cancelled Runs 计数 总计(总和)、平均值、最小值、最大值、计数 Scenario、、RunTypePublishedPipelineIdComputeTypePipelineStepTypeExperimentName PT1M
已完成的运行数

已成功为此工作区完成的运行数。 当运行完成并收集输出时,将更新计数。
Completed Runs 计数 总计(总和)、平均值、最小值、最大值、计数 Scenario、、RunTypePublishedPipelineIdComputeTypePipelineStepTypeExperimentName PT1M
错误

此工作区中的运行错误数。 运行遇到错误时,将更新计数。
Errors 计数 总计(总和)、平均值、最小值、最大值、计数 Scenario PT1M
失败的运行次数

此工作区失败的运行数。 运行失败时,将更新计数。
Failed Runs 计数 总计(总和)、平均值、最小值、最大值、计数 Scenario、、RunTypePublishedPipelineIdComputeTypePipelineStepTypeExperimentName PT1M
完成状态运行数

此工作区的进入完成状态的运行数。 运行已完成但输出收集仍在进行时,将更新计数。
Finalizing Runs 计数 总计(总和)、平均值、最小值、最大值、计数 Scenario、、RunTypePublishedPipelineIdComputeTypePipelineStepTypeExperimentName PT1M
无响应运行数

此工作区无响应的运行数。 当运行进入无响应状态时,将更新计数。
Not Responding Runs 计数 总计(总和)、平均值、最小值、最大值、计数 Scenario、、RunTypePublishedPipelineIdComputeTypePipelineStepTypeExperimentName PT1M
未启动运行

此工作区处于“未启动”状态的运行数。 当收到创建运行的请求但尚未填充运行信息时,将更新计数。
Not Started Runs 计数 总计(总和)、平均值、最小值、最大值、计数 Scenario、、RunTypePublishedPipelineIdComputeTypePipelineStepTypeExperimentName PT1M
准备的运行数

为此工作区准备的运行数。 准备运行环境时,当运行进入准备状态时,将更新计数。
Preparing Runs 计数 总计(总和)、平均值、最小值、最大值、计数 Scenario、、RunTypePublishedPipelineIdComputeTypePipelineStepTypeExperimentName PT1M
预配运行数

为此工作区预配的运行数。 当运行正在等待创建或预配计算目标时,将更新计数。
Provisioning Runs 计数 总计(总和)、平均值、最小值、最大值、计数 Scenario、、RunTypePublishedPipelineIdComputeTypePipelineStepTypeExperimentName PT1M
排队运行数

此工作区已排队的运行数。 当运行在计算目标中排队时,将更新计数。 等待所需计算节点准备就绪时,可能会发生。
Queued Runs 计数 总计(总和)、平均值、最小值、最大值、计数 Scenario、、RunTypePublishedPipelineIdComputeTypePipelineStepTypeExperimentName PT1M
已启动的运行数

为此工作区运行的运行数。 运行在所需资源上开始运行时,将更新计数。
Started Runs 计数 总计(总和)、平均值、最小值、最大值、计数 Scenario、、RunTypePublishedPipelineIdComputeTypePipelineStepTypeExperimentName PT1M
启动运行数

为此工作区启动的运行数。 在请求创建运行和运行信息(如运行 ID)已填充后,将更新计数
Starting Runs 计数 总计(总和)、平均值、最小值、最大值、计数 Scenario、、RunTypePublishedPipelineIdComputeTypePipelineStepTypeExperimentName PT1M
警告

此工作区中的运行警告数。 运行遇到警告时,将更新计数。
Warnings 计数 总计(总和)、平均值、最小值、最大值、计数 Scenario PT1M

后续步骤