Microsoft.MachineLearningServices/workspaces/onlineEndpoints/deployments 的支持計量
下表列出 Microsoft.MachineLearningServices/workspaces/onlineEndpoints/deployments 資源類型的可用計量。
資料表標題
計量 - Azure 入口網站中顯示的計量顯示名稱。
Rest API 中的名稱 - REST API 中所指的計量名稱。
單位 - 測量單位。
彙總 - 預設彙總類型。 有效值:Average、Minimum、Maximum、Total、Count。
維度 - 計量可用的維度。
時間精細度 - 取樣計量的間隔。 例如,PT1M
表示計量會每分鐘取樣、每 30 分鐘PT30M
、每小時 PT1H
,以此類推。
DS 匯出 - 計量是否可透過診斷設定導出至 Azure 監視器記錄。
如需匯出計量的資訊,請參閱 - 使用數據收集規則 匯出計量和 在 Azure 監視器中建立診斷設定。
如需計量保留的相關資訊,請參閱 Azure 監視器計量概觀。
類別:資源
計量 | REST API 中的名稱 | 單位 | 彙總 | 維度 | 時間精細度 | DS 匯出 |
---|---|---|---|---|---|---|
CPU 記憶體使用率百分比 執行個體上的記憶體使用率百分比。 使用量會以一分鐘為間隔提供報告。 |
CpuMemoryUtilizationPercentage |
Percent | 下限、上限、平均 | instanceId |
PT1M | Yes |
CPU 使用率百分比 執行個體上的 CPU 使用率百分比。 使用量會以一分鐘為間隔提供報告。 |
CpuUtilizationPercentage |
Percent | 下限、上限、平均 | instanceId |
PT1M | Yes |
每分鐘資料收集錯誤 每分鐘捨棄的資料收集事件數目。 |
DataCollectionErrorsPerMinute |
計數 | 下限、上限、平均 | instanceId 、 、 reason type |
PT1M | No |
每分鐘資料收集活動 每分鐘處理的資料收集事件數目。 |
DataCollectionEventsPerMinute |
計數 | 下限、上限、平均 | instanceId , type |
PT1M | No |
部署容量 部署中的執行個體數目。 |
DeploymentCapacity |
計數 | 下限、上限、平均 | instanceId , State |
PT1M | No |
磁碟使用率 執行個體上的磁碟使用率百分比。 使用量會以一分鐘為間隔提供報告。 |
DiskUtilization |
Percent | 下限、上限、平均 | instanceId , disk |
PT1M | Yes |
以焦耳表示 GPU 能源 GPU 節點上的間隔能源 (焦耳)。 能源會以一分鐘的間隔提供報告。 |
GpuEnergyJoules |
計數 | 下限、上限、平均 | instanceId |
PT1M | No |
GPU 記憶體使用率百分比 執行個體上的 GPU 記憶體使用率百分比。 使用量會以一分鐘為間隔提供報告。 |
GpuMemoryUtilizationPercentage |
Percent | 下限、上限、平均 | instanceId |
PT1M | Yes |
GPU 使用率百分比 執行個體上的 GPU 使用率百分比。 使用量會以一分鐘為間隔提供報告。 |
GpuUtilizationPercentage |
Percent | 下限、上限、平均 | instanceId |
PT1M | Yes |
類別:流量
計量 | REST API 中的名稱 | 單位 | 彙總 | 維度 | 時間精細度 | DS 匯出 |
---|---|---|---|---|---|---|
要求延遲 P50 由在所選時間期間收集之所有要求延遲值彙總的平均 P50 要求延遲 |
RequestLatency_P50 |
毫秒 | 平均 | <none> | PT1M | Yes |
要求延遲 P90 由在所選時間期間收集之所有要求延遲值彙總的平均 P90 要求延遲 |
RequestLatency_P90 |
毫秒 | 平均 | <none> | PT1M | Yes |
要求延遲 P95 由在所選時間期間收集之所有要求延遲值彙總的平均 P95 要求延遲 |
RequestLatency_P95 |
毫秒 | 平均 | <none> | PT1M | Yes |
要求延遲 P99 由在所選時間期間收集之所有要求延遲值彙總的平均 P99 要求延遲 |
RequestLatency_P99 |
毫秒 | 平均 | <none> | PT1M | Yes |
每分鐘要求 在一分鐘內傳送至線上部署的要求數目 |
RequestsPerMinute |
計數 | 平均 | envoy_response_code |
PT1M | No |