共用方式為


Microsoft.MachineLearningServices/workspaces/onlineEndpoints/deployments 的支持計量

下表列出 Microsoft.MachineLearningServices/workspaces/onlineEndpoints/deployments 資源類型的可用計量。

資料表標題

計量 - Azure 入口網站中顯示的計量顯示名稱。
Rest API 中的名稱 - REST API 中所指的計量名稱。
單位 - 測量單位。
彙總 - 預設彙總類型。 有效值:Average、Minimum、Maximum、Total、Count。
維度 - 計量可用的維度
時間精細度 - 取樣計量的間隔。 例如,PT1M 表示計量會每分鐘取樣、每 30 分鐘PT30M、每小時 PT1H,以此類推。
DS 匯出 - 計量是否可透過診斷設定導出至 Azure 監視器記錄。

如需匯出計量的資訊,請參閱 - 使用數據收集規則 匯出計量和 在 Azure 監視器中建立診斷設定。

如需計量保留的相關資訊,請參閱 Azure 監視器計量概觀

類別:資源

計量 REST API 中的名稱 單位 彙總 維度 時間精細度 DS 匯出
CPU 記憶體使用率百分比

執行個體上的記憶體使用率百分比。 使用量會以一分鐘為間隔提供報告。
CpuMemoryUtilizationPercentage Percent 下限、上限、平均 instanceId PT1M Yes
CPU 使用率百分比

執行個體上的 CPU 使用率百分比。 使用量會以一分鐘為間隔提供報告。
CpuUtilizationPercentage Percent 下限、上限、平均 instanceId PT1M Yes
每分鐘資料收集錯誤

每分鐘捨棄的資料收集事件數目。
DataCollectionErrorsPerMinute 計數 下限、上限、平均 instanceId、 、 reasontype PT1M No
每分鐘資料收集活動

每分鐘處理的資料收集事件數目。
DataCollectionEventsPerMinute 計數 下限、上限、平均 instanceId, type PT1M No
部署容量

部署中的執行個體數目。
DeploymentCapacity 計數 下限、上限、平均 instanceId, State PT1M No
磁碟使用率

執行個體上的磁碟使用率百分比。 使用量會以一分鐘為間隔提供報告。
DiskUtilization Percent 下限、上限、平均 instanceId, disk PT1M Yes
以焦耳表示 GPU 能源

GPU 節點上的間隔能源 (焦耳)。 能源會以一分鐘的間隔提供報告。
GpuEnergyJoules 計數 下限、上限、平均 instanceId PT1M No
GPU 記憶體使用率百分比

執行個體上的 GPU 記憶體使用率百分比。 使用量會以一分鐘為間隔提供報告。
GpuMemoryUtilizationPercentage Percent 下限、上限、平均 instanceId PT1M Yes
GPU 使用率百分比

執行個體上的 GPU 使用率百分比。 使用量會以一分鐘為間隔提供報告。
GpuUtilizationPercentage Percent 下限、上限、平均 instanceId PT1M Yes

類別:流量

計量 REST API 中的名稱 單位 彙總 維度 時間精細度 DS 匯出
要求延遲 P50

由在所選時間期間收集之所有要求延遲值彙總的平均 P50 要求延遲
RequestLatency_P50 毫秒 平均 <none> PT1M Yes
要求延遲 P90

由在所選時間期間收集之所有要求延遲值彙總的平均 P90 要求延遲
RequestLatency_P90 毫秒 平均 <none> PT1M Yes
要求延遲 P95

由在所選時間期間收集之所有要求延遲值彙總的平均 P95 要求延遲
RequestLatency_P95 毫秒 平均 <none> PT1M Yes
要求延遲 P99

由在所選時間期間收集之所有要求延遲值彙總的平均 P99 要求延遲
RequestLatency_P99 毫秒 平均 <none> PT1M Yes
每分鐘要求

在一分鐘內傳送至線上部署的要求數目
RequestsPerMinute 計數 平均 envoy_response_code PT1M No

下一步