你当前正在访问 Microsoft Azure Global Edition 技术文档网站。 如果需要访问由世纪互联运营的 Microsoft Azure 中国技术文档网站,请访问 https://docs.azure.cn。
Microsoft.MachineLearningServices/workspaces/onlineEndpoints/deployments 支持的指标
下表列出了可用于 Microsoft.MachineLearningServices/workspaces/onlineEndpoints/deployments 资源类型的指标。
表标题
指标 - 在 Azure 门户中显示的指标显示名称。
Rest API 中的名称 - 在 REST API 中引用的指标名称。
单位 - 度量单位。
聚合 - 默认的聚合类型。 有效值:平均值、最小值、最大值、总计、计数。
维度 - 适用于指标的维度。
时间粒度 - 对指标采样的间隔。 例如,PT1M
表示该指标每分钟采样一次,PT30M
表示每 30 分钟一次,PT1H
表示每小时一次,以此类推。
DS 导出 - 是否可通过诊断设置将指标导出到 Azure Monitor 日志。
有关导出指标的信息,请参阅 - 使用数据收集规则 导出指标并在 Azure Monitor 中创建诊断设置。
有关指标保留的信息,请参阅 Azure Monitor 指标概述。
类别 | 指标 | REST API 中的名称 | Unit | 聚合 | 维度 | 时间粒度 | DS 导出 |
---|---|---|---|---|---|---|---|
资源 | CPU 内存利用率百分比 实例上的内存利用率百分比。 利用率每分钟报告一次。 |
CpuMemoryUtilizationPercentage |
百分比 | 最小值、最大值、平均值 | instanceId |
PT1M | 是 |
资源 | CPU 利用率百分比 实例上的 CPU 利用率百分比。 利用率每分钟报告一次。 |
CpuUtilizationPercentage |
百分比 | 最小值、最大值、平均值 | instanceId |
PT1M | 是 |
资源 | 每分钟数据收集错误数 每分钟删除的数据收集事件数。 |
DataCollectionErrorsPerMinute |
计数 | 最小值、最大值、平均值 | instanceId 、 reason 、、 type |
PT1M | 否 |
资源 | 每分钟数据收集事件数 每分钟处理的数据收集事件数。 |
DataCollectionEventsPerMinute |
计数 | 最小值、最大值、平均值 | instanceId , type |
PT1M | 否 |
资源 | 部署容量 部署中的实例数。 |
DeploymentCapacity |
计数 | 最小值、最大值、平均值 | instanceId , State |
PT1M | 否 |
资源 | 磁盘利用率 实例上的磁盘利用率百分比。 利用率每分钟报告一次。 |
DiskUtilization |
百分比 | 最小值、最大值、平均值 | instanceId , disk |
PT1M | 是 |
资源 | GPU 能量(焦耳) GPU 节点上的间隔功耗(焦耳)。 功耗每分钟报告一次。 |
GpuEnergyJoules |
计数 | 最小值、最大值、平均值 | instanceId |
PT1M | 否 |
资源 | GPU 内存利用率百分比 实例上的 GPU 内存利用率百分比。 利用率每分钟报告一次。 |
GpuMemoryUtilizationPercentage |
百分比 | 最小值、最大值、平均值 | instanceId |
PT1M | 是 |
资源 | GPU 利用率百分比 实例上的 GPU 利用率百分比。 利用率每分钟报告一次。 |
GpuUtilizationPercentage |
百分比 | 最小值、最大值、平均值 | instanceId |
PT1M | 是 |
交通 | P50 请求延迟 按所选时间段内收集的所有请求延迟值聚合的平均 P50 请求延迟 |
RequestLatency_P50 |
毫秒 | 平均值 | <无> | PT1M | 是 |
交通 | P90 请求延迟 按所选时间段内收集的所有请求延迟值聚合的平均 P90 请求延迟 |
RequestLatency_P90 |
毫秒 | 平均值 | <无> | PT1M | 是 |
交通 | P95 请求延迟 按所选时间段内收集的所有请求延迟值聚合的平均 P95 请求延迟 |
RequestLatency_P95 |
毫秒 | 平均值 | <无> | PT1M | 是 |
交通 | P99 请求延迟 按所选时间段内收集的所有请求延迟值聚合的平均 P99 请求延迟 |
RequestLatency_P99 |
毫秒 | 平均值 | <无> | PT1M | 是 |
交通 | 每分钟请求数 在一分钟内发送到联机部署的请求数 |
RequestsPerMinute |
计数 | 平均值 | envoy_response_code |
PT1M | 否 |