次の方法で共有


Microsoft.MachineLearningServices/workspaces/onlineEndpoints/deployments でサポートされているメトリック

次の表に、Microsoft.MachineLearningServices/workspaces/onlineEndpoints/deployments リソースの種類で使用できるメトリックを示します。

テーブルの見出し

メトリック - Azure Portal に表示されるメトリックの表示名。
Rest API の名前 - REST API で参照されるメトリック名
単位 - 測定単位。
集計 - 既定の集計の種類。 有効な値: 平均、最小、最大、合計、数。
ディメンション - メトリックで使用できるディメンション
時間グレイン - メトリックをサンプリングする間隔。 たとえば、PT1M は、メトリックを 1 分ごとに、PT30Mは 30 分ごとに、PT1H は 1 時間ごとにサンプリングすることを示します。
DS エクスポート - メトリックが診断設定を介して Azure Monitor ログにエクスポート可能かどうかを示します。

メトリックのエクスポートの詳細については、「データ収集ルールを使用したメトリックのエクスポートおよび Azure Monitor での診断設定の作成を参照してください。

メトリックのリテンション期間の詳細については、「Azure Monitor メトリックの概要」を参照してください。

カテゴリ: リソース

メトリック REST API での名前 出荷単位 集計 Dimensions 期間粒度 DS エクスポート
CPU メモリ使用率

インスタンスのメモリ使用率 (%)。 使用率は 1 分間隔で報告されます。
CpuMemoryUtilizationPercentage パーセント Minimum、Maximum、Average instanceId PT1M はい
CPU 使用率

インスタンスの CPU 使用率 (%)。 使用率は 1 分間隔で報告されます。
CpuUtilizationPercentage パーセント Minimum、Maximum、Average instanceId PT1M はい
1 分あたりのデータ収集エラー数

1 分あたりに破棄されたデータ収集イベントの数。
DataCollectionErrorsPerMinute カウント Minimum、Maximum、Average instanceIdreasontype PT1M いいえ
1 分あたりのデータ収集イベント数

1 分あたりに処理されたデータ収集イベントの数。
DataCollectionEventsPerMinute カウント Minimum、Maximum、Average instanceId, type PT1M いいえ
デプロイ容量

デプロイ内のインスタンスの数。
DeploymentCapacity カウント Minimum、Maximum、Average instanceId, State PT1M いいえ
ディスク使用量

インスタンスのディスク使用率 (%)。 使用率は 1 分間隔で報告されます。
DiskUtilization パーセント Minimum、Maximum、Average instanceId, disk PT1M はい
GPU エネルギー (ジュール単位)

GPU ノードでのコンセントのエネルギーの間隔 (ジュール単位)。 エネルギーは 1 分間隔で報告されます。
GpuEnergyJoules カウント Minimum、Maximum、Average instanceId PT1M いいえ
GPU メモリ使用率

インスタンスの GPU メモリ使用率 (%)。 使用率は 1 分間隔で報告されます。
GpuMemoryUtilizationPercentage パーセント Minimum、Maximum、Average instanceId PT1M はい
GPU 使用率

インスタンスの GPU 使用率 (%)。 使用率は 1 分間隔で報告されます。
GpuUtilizationPercentage パーセント Minimum、Maximum、Average instanceId PT1M はい

カテゴリ: トラフィック

メトリック REST API での名前 出荷単位 集計 Dimensions 期間粒度 DS エクスポート
要求の待機時間 P50

選択した期間に収集されたすべての要求待機時間値によって集計された P50 要求の平均待機時間
RequestLatency_P50 ミリ秒 Average <なし> PT1M はい
要求の待機時間 P90

選択した期間に収集されたすべての要求待機時間値によって集計された P90 要求の平均待機時間
RequestLatency_P90 ミリ秒 Average <なし> PT1M はい
要求の待機時間 P95

選択した期間に収集されたすべての要求待機時間値によって集計された P95 要求の平均待機時間
RequestLatency_P95 ミリ秒 Average <なし> PT1M はい
要求の待機時間 P99

選択した期間に収集されたすべての要求待機時間値によって集計された P99 要求の平均待機時間
RequestLatency_P99 ミリ秒 Average <なし> PT1M はい
1 分あたりの要求数

1 分以内にオンライン デプロイに送信された要求の数
RequestsPerMinute Count Average envoy_response_code PT1M いいえ

次のステップ