你当前正在访问 Microsoft Azure Global Edition 技术文档网站。 如果需要访问由世纪互联运营的 Microsoft Azure 中国技术文档网站,请访问 https://docs.azure.cn

Microsoft.MachineLearningServices/workspaces/onlineEndpoints/deployments 支持的指标

下表列出了可用于 Microsoft.MachineLearningServices/workspaces/onlineEndpoints/deployments 资源类型的指标。

表标题

指标 - 在 Azure 门户中显示的指标显示名称。
Rest API 中的名称 - 在 REST API 中引用的指标名称。
单位 - 度量单位。
聚合 - 默认的聚合类型。 有效值:平均值、最小值、最大值、总计、计数。
维度 - 适用于指标的维度
时间粒度 - 对指标采样的间隔。 例如,PT1M 表示该指标每分钟采样一次,PT30M 表示每 30 分钟一次,PT1H 表示每小时一次,以此类推。
DS 导出 - 是否可通过诊断设置将指标导出到 Azure Monitor 日志。

有关导出指标的信息,请参阅 - 使用数据收集规则 导出指标并在 Azure Monitor 中创建诊断设置。

有关指标保留的信息,请参阅 Azure Monitor 指标概述

类别 指标 REST API 中的名称 Unit 聚合 维度 时间粒度 DS 导出
资源 CPU 内存利用率百分比

实例上的内存利用率百分比。 利用率每分钟报告一次。
CpuMemoryUtilizationPercentage 百分比 最小值、最大值、平均值 instanceId PT1M
资源 CPU 利用率百分比

实例上的 CPU 利用率百分比。 利用率每分钟报告一次。
CpuUtilizationPercentage 百分比 最小值、最大值、平均值 instanceId PT1M
资源 每分钟数据收集错误数

每分钟删除的数据收集事件数。
DataCollectionErrorsPerMinute 计数 最小值、最大值、平均值 instanceIdreason、、 type PT1M
资源 每分钟数据收集事件数

每分钟处理的数据收集事件数。
DataCollectionEventsPerMinute 计数 最小值、最大值、平均值 instanceId, type PT1M
资源 部署容量

部署中的实例数。
DeploymentCapacity 计数 最小值、最大值、平均值 instanceId, State PT1M
资源 磁盘利用率

实例上的磁盘利用率百分比。 利用率每分钟报告一次。
DiskUtilization 百分比 最小值、最大值、平均值 instanceId, disk PT1M
资源 GPU 能量(焦耳)

GPU 节点上的间隔功耗(焦耳)。 功耗每分钟报告一次。
GpuEnergyJoules 计数 最小值、最大值、平均值 instanceId PT1M
资源 GPU 内存利用率百分比

实例上的 GPU 内存利用率百分比。 利用率每分钟报告一次。
GpuMemoryUtilizationPercentage 百分比 最小值、最大值、平均值 instanceId PT1M
资源 GPU 利用率百分比

实例上的 GPU 利用率百分比。 利用率每分钟报告一次。
GpuUtilizationPercentage 百分比 最小值、最大值、平均值 instanceId PT1M
交通 P50 请求延迟

按所选时间段内收集的所有请求延迟值聚合的平均 P50 请求延迟
RequestLatency_P50 毫秒 平均值 <无> PT1M
交通 P90 请求延迟

按所选时间段内收集的所有请求延迟值聚合的平均 P90 请求延迟
RequestLatency_P90 毫秒 平均值 <无> PT1M
交通 P95 请求延迟

按所选时间段内收集的所有请求延迟值聚合的平均 P95 请求延迟
RequestLatency_P95 毫秒 平均值 <无> PT1M
交通 P99 请求延迟

按所选时间段内收集的所有请求延迟值聚合的平均 P99 请求延迟
RequestLatency_P99 毫秒 平均值 <无> PT1M
交通 每分钟请求数

在一分钟内发送到联机部署的请求数
RequestsPerMinute 计数 平均值 envoy_response_code PT1M

后续步骤