Métriques prises en charge pour Microsoft.MachineLearningServices/workspaces/onlineEndpoints/deployments

Article
01/03/2025

Le tableau suivant répertorie les métriques disponibles pour le type de ressource Microsoft.MachineLearningServices/workspaces/onlineEndpoints/deployments.

Titres du tableau

Métrique : nom complet de la métrique tel qu’il apparaît dans le portail Azure.
Nom dans l’API Rest : nom de métrique appelé dans l’API REST.
Unité : unité de mesure.
Agrégation : le type d’agrégation par défaut. Valeurs valides : Moyen, Minimum, Maximum, Total, Nombre.
Dimensions - Dimensions disponibles pour la métrique.
Fragments de temps - Intervalles auxquels la métrique est échantillonnée. Par exemple, PT1M indique que la métrique est échantillonnée toutes les minutes, PT30M toutes les 30 minutes, PT1H toutes les heures, et ainsi de suite.
Exportation DS : indique si la métrique est exportable vers les journaux Azure Monitor via les paramètres de diagnostic.

Pour plus d’informations sur l’exportation des métriques, consultez : exportation des métriques à l’aide de règles de collecte de données et création de paramètres de diagnostic dans Azure Monitor.

Pour plus d’informations sur les métriques de surveillance, consultez la section Présentation des métriques Azure Monitor.

Catégorie	Métrique	Nom dans l’API REST	Unité	Agrégation	Dimensions	Fragments de temps	Exportation DS
Ressource	Pourcentage d’utilisation de la mémoire du processeur Pourcentage d’utilisation de la mémoire sur une instance. L’utilisation est rapportée à intervalles d’une minute.	`CpuMemoryUtilizationPercentage`	Pourcentage	Minimum, Maximum, Moyenne	`instanceId`	PT1M	Oui
Ressource	Pourcentage d’utilisation du processeur Pourcentage d’utilisation du processeur sur une instance. L’utilisation est rapportée à intervalles d’une minute.	`CpuUtilizationPercentage`	Pourcentage	Minimum, Maximum, Moyenne	`instanceId`	PT1M	Oui
Ressource	Erreurs de collecte de données par minute Nombre d’événements de collecte de données abandonnés par minute.	`DataCollectionErrorsPerMinute`	Count	Minimum, Maximum, Moyenne	`instanceId`, , `reasontype`	PT1M	Non
Ressource	Événements de collecte de données par minute Nombre d’événements de collecte de données traités par minute.	`DataCollectionEventsPerMinute`	Count	Minimum, Maximum, Moyenne	`instanceId`, `type`	PT1M	Non
Ressource	Capacité de déploiement Nombre d’instances dans le déploiement.	`DeploymentCapacity`	Count	Minimum, Maximum, Moyenne	`instanceId`, `State`	PT1M	Non
Ressource	Utilisation du disque Pourcentage d’utilisation du disque sur une instance. L’utilisation est rapportée à intervalles d’une minute.	`DiskUtilization`	Pourcentage	Minimum, Maximum, Moyenne	`instanceId`, `disk`	PT1M	Oui
Ressource	Énergie de processeur graphique en joules Énergie par intervalle en joules sur un nœud GPU. L’énergie est rapportée à intervalles d’une minute.	`GpuEnergyJoules`	Count	Minimum, Maximum, Moyenne	`instanceId`	PT1M	Non
Ressource	Pourcentage d’utilisation de la mémoire du processeur graphique Pourcentage d’utilisation de la mémoire GPU sur une instance. L’utilisation est rapportée à intervalles d’une minute.	`GpuMemoryUtilizationPercentage`	Pourcentage	Minimum, Maximum, Moyenne	`instanceId`	PT1M	Oui
Ressource	Pourcentage d’utilisation du processeur graphique Pourcentage d’utilisation du GPU sur une instance. L’utilisation est rapportée à intervalles d’une minute.	`GpuUtilizationPercentage`	Pourcentage	Minimum, Maximum, Moyenne	`instanceId`	PT1M	Oui
Trafic	Latence de requête P50 Latence moyenne de requête P50 agrégée par toutes les valeurs de latence de requête collectées sur la période sélectionnée	`RequestLatency_P50`	Millisecondes	Average	<aucune>	PT1M	Oui
Trafic	Latence de requête P90 Latence moyenne de requête P90 agrégée par toutes les valeurs de latence de requête collectées sur la période sélectionnée	`RequestLatency_P90`	Millisecondes	Average	<aucune>	PT1M	Oui
Trafic	Latence de requête P95 Latence moyenne de requête P95 agrégée par toutes les valeurs de latence de requête collectées sur la période sélectionnée	`RequestLatency_P95`	Millisecondes	Average	<aucune>	PT1M	Oui
Trafic	Latence de requête P99 Latence moyenne de requête P99 agrégée par toutes les valeurs de latence de requête collectées sur la période sélectionnée	`RequestLatency_P99`	Millisecondes	Average	<aucune>	PT1M	Oui
Trafic	Requêtes par minute Nombre de requêtes envoyées au déploiement en ligne en une minute	`RequestsPerMinute`	Count	Average	`envoy_response_code`	PT1M	Non

Partager via

Métriques prises en charge pour Microsoft.MachineLearningServices/workspaces/onlineEndpoints/deployments

Étapes suivantes

Commentaires

Ressources supplémentaires