Métriques prises en charge pour Microsoft.MachineLearningServices/workspaces/onlineEndpoints/deployments
Le tableau suivant répertorie les métriques disponibles pour le type de ressource Microsoft.MachineLearningServices/workspaces/onlineEndpoints/deployments.
Titres du tableau
Métrique : nom complet de la métrique tel qu’il apparaît dans le portail Azure.
Nom dans l’API Rest : nom de métrique appelé dans l’API REST.
Unité : unité de mesure.
Agrégation : le type d’agrégation par défaut. Valeurs valides : Moyen, Minimum, Maximum, Total, Nombre.
Dimensions - Dimensions disponibles pour la métrique.
Fragments de temps - Intervalles auxquels la métrique est échantillonnée. Par exemple, PT1M
indique que la métrique est échantillonnée toutes les minutes, PT30M
toutes les 30 minutes, PT1H
toutes les heures, et ainsi de suite.
Exportation DS : indique si la métrique est exportable vers les journaux Azure Monitor via les paramètres de diagnostic.
Pour plus d’informations sur l’exportation des métriques, consultez Créer des paramètres de diagnostic dans Azure Monitor.
Pour plus d’informations sur les métriques de surveillance, consultez la section Présentation des métriques Azure Monitor.
Catégorie | Métrique | Nom dans l’API REST | Unité | Agrégation | Dimensions | Fragments de temps | Exportation DS |
---|---|---|---|---|---|---|---|
Ressource | Pourcentage d’utilisation de la mémoire du processeur Pourcentage d’utilisation de la mémoire sur une instance. L’utilisation est rapportée à intervalles d’une minute. |
CpuMemoryUtilizationPercentage |
Pourcentage | Minimum, Maximum, Moyenne | instanceId |
PT1M | Oui |
Ressource | Pourcentage d’utilisation du processeur Pourcentage d’utilisation du processeur sur une instance. L’utilisation est rapportée à intervalles d’une minute. |
CpuUtilizationPercentage |
Pourcentage | Minimum, Maximum, Moyenne | instanceId |
PT1M | Oui |
Ressource | Erreurs de collecte de données par minute Nombre d’événements de collecte de données abandonnés par minute. |
DataCollectionErrorsPerMinute |
Count | Minimum, Maximum, Moyenne | instanceId , , reason type |
PT1M | Non |
Ressource | Événements de collecte de données par minute Nombre d’événements de collecte de données traités par minute. |
DataCollectionEventsPerMinute |
Count | Minimum, Maximum, Moyenne | instanceId , type |
PT1M | Non |
Ressource | Capacité de déploiement Nombre d’instances dans le déploiement. |
DeploymentCapacity |
Count | Minimum, Maximum, Moyenne | instanceId , State |
PT1M | Non |
Ressource | Utilisation du disque Pourcentage d’utilisation du disque sur une instance. L’utilisation est rapportée à intervalles d’une minute. |
DiskUtilization |
Pourcentage | Minimum, Maximum, Moyenne | instanceId , disk |
PT1M | Oui |
Ressource | Énergie de processeur graphique en joules Énergie par intervalle en joules sur un nœud GPU. L’énergie est rapportée à intervalles d’une minute. |
GpuEnergyJoules |
Count | Minimum, Maximum, Moyenne | instanceId |
PT1M | Non |
Ressource | Pourcentage d’utilisation de la mémoire du processeur graphique Pourcentage d’utilisation de la mémoire GPU sur une instance. L’utilisation est rapportée à intervalles d’une minute. |
GpuMemoryUtilizationPercentage |
Pourcentage | Minimum, Maximum, Moyenne | instanceId |
PT1M | Oui |
Ressource | Pourcentage d’utilisation du processeur graphique Pourcentage d’utilisation du GPU sur une instance. L’utilisation est rapportée à intervalles d’une minute. |
GpuUtilizationPercentage |
Pourcentage | Minimum, Maximum, Moyenne | instanceId |
PT1M | Oui |
Trafic | Latence de requête P50 Latence moyenne de requête P50 agrégée par toutes les valeurs de latence de requête collectées sur la période sélectionnée |
RequestLatency_P50 |
Millisecondes | Average | <aucune> | PT1M | Oui |
Trafic | Latence de requête P90 Latence moyenne de requête P90 agrégée par toutes les valeurs de latence de requête collectées sur la période sélectionnée |
RequestLatency_P90 |
Millisecondes | Average | <aucune> | PT1M | Oui |
Trafic | Latence de requête P95 Latence moyenne de requête P95 agrégée par toutes les valeurs de latence de requête collectées sur la période sélectionnée |
RequestLatency_P95 |
Millisecondes | Average | <aucune> | PT1M | Oui |
Trafic | Latence de requête P99 Latence moyenne de requête P99 agrégée par toutes les valeurs de latence de requête collectées sur la période sélectionnée |
RequestLatency_P99 |
Millisecondes | Average | <aucune> | PT1M | Oui |
Trafic | Requêtes par minute Nombre de requêtes envoyées au déploiement en ligne en une minute |
RequestsPerMinute |
Count | Average | envoy_response_code |
PT1M | Non |