Microsoft.MachineLearningServices/workspaces/onlineEndpoints/deployments でサポートされているメトリック
次の表に、Microsoft.MachineLearningServices/workspaces/onlineEndpoints/deployments リソースの種類で使用できるメトリックを示します。
テーブルの見出し
メトリック - Azure Portal に表示されるメトリックの表示名。
Rest API の名前 - REST API で参照されるメトリック名。
単位 - 測定単位。
集計 - 既定の集計の種類。 有効な値: 平均、最小、最大、合計、数。
ディメンション - メトリックで使用できるディメンション。
時間グレイン - メトリックをサンプリングする間隔。 たとえば、PT1M
は、メトリックを 1 分ごとに、PT30M
は 30 分ごとに、PT1H
は 1 時間ごとにサンプリングすることを示します。
DS エクスポート - メトリックが診断設定を介して Azure Monitor ログにエクスポート可能かどうかを示します。
メトリックのエクスポートの詳細については、「データ収集ルールを使用したメトリックのエクスポートおよび Azure Monitor での診断設定の作成を参照してください。
メトリックのリテンション期間の詳細については、「Azure Monitor メトリックの概要」を参照してください。
カテゴリ: リソース
メトリック | REST API での名前 | 出荷単位 | 集計 | Dimensions | 期間粒度 | DS エクスポート |
---|---|---|---|---|---|---|
CPU メモリ使用率 インスタンスのメモリ使用率 (%)。 使用率は 1 分間隔で報告されます。 |
CpuMemoryUtilizationPercentage |
パーセント | Minimum、Maximum、Average | instanceId |
PT1M | はい |
CPU 使用率 インスタンスの CPU 使用率 (%)。 使用率は 1 分間隔で報告されます。 |
CpuUtilizationPercentage |
パーセント | Minimum、Maximum、Average | instanceId |
PT1M | はい |
1 分あたりのデータ収集エラー数 1 分あたりに破棄されたデータ収集イベントの数。 |
DataCollectionErrorsPerMinute |
カウント | Minimum、Maximum、Average | instanceId 、 reason 、 type |
PT1M | いいえ |
1 分あたりのデータ収集イベント数 1 分あたりに処理されたデータ収集イベントの数。 |
DataCollectionEventsPerMinute |
カウント | Minimum、Maximum、Average | instanceId , type |
PT1M | いいえ |
デプロイ容量 デプロイ内のインスタンスの数。 |
DeploymentCapacity |
カウント | Minimum、Maximum、Average | instanceId , State |
PT1M | いいえ |
ディスク使用量 インスタンスのディスク使用率 (%)。 使用率は 1 分間隔で報告されます。 |
DiskUtilization |
パーセント | Minimum、Maximum、Average | instanceId , disk |
PT1M | はい |
GPU エネルギー (ジュール単位) GPU ノードでのコンセントのエネルギーの間隔 (ジュール単位)。 エネルギーは 1 分間隔で報告されます。 |
GpuEnergyJoules |
カウント | Minimum、Maximum、Average | instanceId |
PT1M | いいえ |
GPU メモリ使用率 インスタンスの GPU メモリ使用率 (%)。 使用率は 1 分間隔で報告されます。 |
GpuMemoryUtilizationPercentage |
パーセント | Minimum、Maximum、Average | instanceId |
PT1M | はい |
GPU 使用率 インスタンスの GPU 使用率 (%)。 使用率は 1 分間隔で報告されます。 |
GpuUtilizationPercentage |
パーセント | Minimum、Maximum、Average | instanceId |
PT1M | はい |
カテゴリ: トラフィック
メトリック | REST API での名前 | 出荷単位 | 集計 | Dimensions | 期間粒度 | DS エクスポート |
---|---|---|---|---|---|---|
要求の待機時間 P50 選択した期間に収集されたすべての要求待機時間値によって集計された P50 要求の平均待機時間 |
RequestLatency_P50 |
ミリ秒 | Average | <なし> | PT1M | はい |
要求の待機時間 P90 選択した期間に収集されたすべての要求待機時間値によって集計された P90 要求の平均待機時間 |
RequestLatency_P90 |
ミリ秒 | Average | <なし> | PT1M | はい |
要求の待機時間 P95 選択した期間に収集されたすべての要求待機時間値によって集計された P95 要求の平均待機時間 |
RequestLatency_P95 |
ミリ秒 | Average | <なし> | PT1M | はい |
要求の待機時間 P99 選択した期間に収集されたすべての要求待機時間値によって集計された P99 要求の平均待機時間 |
RequestLatency_P99 |
ミリ秒 | Average | <なし> | PT1M | はい |
1 分あたりの要求数 1 分以内にオンライン デプロイに送信された要求の数 |
RequestsPerMinute |
Count | Average | envoy_response_code |
PT1M | いいえ |