Partager via


Métriques prises en charge pour Microsoft.MachineLearningServices/workspaces/onlineEndpoints/deployments

Le tableau suivant répertorie les métriques disponibles pour le type de ressource Microsoft.MachineLearningServices/workspaces/onlineEndpoints/deployments.

Titres du tableau

Métrique : nom complet de la métrique tel qu’il apparaît dans le portail Azure.
Nom dans l’API Rest : nom de métrique appelé dans l’API REST.
Unité : unité de mesure.
Agrégation : le type d’agrégation par défaut. Valeurs valides : Moyen, Minimum, Maximum, Total, Nombre.
Dimensions - Dimensions disponibles pour la métrique.
Fragments de temps - Intervalles auxquels la métrique est échantillonnée. Par exemple, PT1M indique que la métrique est échantillonnée toutes les minutes, PT30M toutes les 30 minutes, PT1H toutes les heures, et ainsi de suite.
Exportation DS : indique si la métrique est exportable vers les journaux Azure Monitor via les paramètres de diagnostic.

Pour plus d’informations sur l’exportation des métriques, consultez Créer des paramètres de diagnostic dans Azure Monitor.

Pour plus d’informations sur les métriques de surveillance, consultez la section Présentation des métriques Azure Monitor.

Catégorie Métrique Nom dans l’API REST Unité Agrégation Dimensions Fragments de temps Exportation DS
Ressource Pourcentage d’utilisation de la mémoire du processeur

Pourcentage d’utilisation de la mémoire sur une instance. L’utilisation est rapportée à intervalles d’une minute.
CpuMemoryUtilizationPercentage Pourcentage Minimum, Maximum, Moyenne instanceId PT1M Oui
Ressource Pourcentage d’utilisation du processeur

Pourcentage d’utilisation du processeur sur une instance. L’utilisation est rapportée à intervalles d’une minute.
CpuUtilizationPercentage Pourcentage Minimum, Maximum, Moyenne instanceId PT1M Oui
Ressource Erreurs de collecte de données par minute

Nombre d’événements de collecte de données abandonnés par minute.
DataCollectionErrorsPerMinute Count Minimum, Maximum, Moyenne instanceId, , reasontype PT1M Non
Ressource Événements de collecte de données par minute

Nombre d’événements de collecte de données traités par minute.
DataCollectionEventsPerMinute Count Minimum, Maximum, Moyenne instanceId, type PT1M Non
Ressource Capacité de déploiement

Nombre d’instances dans le déploiement.
DeploymentCapacity Count Minimum, Maximum, Moyenne instanceId, State PT1M Non
Ressource Utilisation du disque

Pourcentage d’utilisation du disque sur une instance. L’utilisation est rapportée à intervalles d’une minute.
DiskUtilization Pourcentage Minimum, Maximum, Moyenne instanceId, disk PT1M Oui
Ressource Énergie de processeur graphique en joules

Énergie par intervalle en joules sur un nœud GPU. L’énergie est rapportée à intervalles d’une minute.
GpuEnergyJoules Count Minimum, Maximum, Moyenne instanceId PT1M Non
Ressource Pourcentage d’utilisation de la mémoire du processeur graphique

Pourcentage d’utilisation de la mémoire GPU sur une instance. L’utilisation est rapportée à intervalles d’une minute.
GpuMemoryUtilizationPercentage Pourcentage Minimum, Maximum, Moyenne instanceId PT1M Oui
Ressource Pourcentage d’utilisation du processeur graphique

Pourcentage d’utilisation du GPU sur une instance. L’utilisation est rapportée à intervalles d’une minute.
GpuUtilizationPercentage Pourcentage Minimum, Maximum, Moyenne instanceId PT1M Oui
Trafic Latence de requête P50

Latence moyenne de requête P50 agrégée par toutes les valeurs de latence de requête collectées sur la période sélectionnée
RequestLatency_P50 Millisecondes Average <aucune> PT1M Oui
Trafic Latence de requête P90

Latence moyenne de requête P90 agrégée par toutes les valeurs de latence de requête collectées sur la période sélectionnée
RequestLatency_P90 Millisecondes Average <aucune> PT1M Oui
Trafic Latence de requête P95

Latence moyenne de requête P95 agrégée par toutes les valeurs de latence de requête collectées sur la période sélectionnée
RequestLatency_P95 Millisecondes Average <aucune> PT1M Oui
Trafic Latence de requête P99

Latence moyenne de requête P99 agrégée par toutes les valeurs de latence de requête collectées sur la période sélectionnée
RequestLatency_P99 Millisecondes Average <aucune> PT1M Oui
Trafic Requêtes par minute

Nombre de requêtes envoyées au déploiement en ligne en une minute
RequestsPerMinute Count Average envoy_response_code PT1M Non