Métriques prises en charge pour Microsoft.MachineLearningServices/workspaces/onlineEndpoints
Le tableau suivant répertorie les métriques disponibles pour le type de ressource Microsoft.MachineLearningServices/workspaces/onlineEndpoints.
Titres du tableau
Métrique : nom complet de la métrique tel qu’il apparaît dans le portail Azure.
Nom dans l’API Rest : nom de métrique appelé dans l’API REST.
Unité : unité de mesure.
Agrégation : le type d’agrégation par défaut. Valeurs valides : Moyen, Minimum, Maximum, Total, Nombre.
Dimensions - Dimensions disponibles pour la métrique.
Fragments de temps - Intervalles auxquels la métrique est échantillonnée. Par exemple, PT1M
indique que la métrique est échantillonnée toutes les minutes, PT30M
toutes les 30 minutes, PT1H
toutes les heures, et ainsi de suite.
Exportation DS : indique si la métrique est exportable vers les journaux Azure Monitor via les paramètres de diagnostic.
Pour plus d’informations sur l’exportation des métriques, consultez : exportation des métriques à l’aide de règles de collecte de données et création de paramètres de diagnostic dans Azure Monitor.
Pour plus d’informations sur les métriques de surveillance, consultez la section Présentation des métriques Azure Monitor.
Pour obtenir la liste des journaux pris en charge, consultez Catégories de journaux prises en charge - Microsoft.MachineLearningServices/workspaces/onlineEndpoints
Catégorie | Métrique | Nom dans l’API REST | Unité | Agrégation | Dimensions | Fragments de temps | Exportation DS |
---|---|---|---|---|---|---|---|
Trafic | Connexions actives Nombre total de connexions TCP simultanées actives établies à partir de clients. |
ConnectionsActive |
Count | Average | <aucune> | PT1M | Non |
Trafic | Erreurs de collecte de données par minute Nombre d’événements de collecte de données abandonnés par minute. |
DataCollectionErrorsPerMinute |
Count | Minimum, Maximum, Moyenne | deployment , , reason type |
PT1M | Non |
Trafic | Événements de collecte de données par minute Nombre d’événements de collecte de données traités par minute. |
DataCollectionEventsPerMinute |
Count | Minimum, Maximum, Moyenne | deployment , type |
PT1M | Non |
Trafic | Octets réseau Octets par seconde traités pour le point de terminaison. |
NetworkBytes |
BytesPerSecond | Average | <aucune> | PT1M | Non |
Trafic | Nouvelles connexions par seconde Nombre moyen de nouvelles connexions TCP par seconde établies à partir de clients. |
NewConnectionsPerSecond |
CountPerSecond | Average | <aucune> | PT1M | Non |
Trafic | Latence de requête Intervalle de temps total moyen pour répondre à une requête, en millisecondes |
RequestLatency |
Millisecondes | Average | deployment |
PT1M | Oui |
Trafic | Latence de requête P50 Latence moyenne de requête P50 agrégée par toutes les valeurs de latence de requête collectées sur la période sélectionnée |
RequestLatency_P50 |
Millisecondes | Average | deployment |
PT1M | Oui |
Trafic | Latence de requête P90 Latence moyenne de requête P90 agrégée par toutes les valeurs de latence de requête collectées sur la période sélectionnée |
RequestLatency_P90 |
Millisecondes | Average | deployment |
PT1M | Oui |
Trafic | Latence de requête P95 Latence moyenne de requête P95 agrégée par toutes les valeurs de latence de requête collectées sur la période sélectionnée |
RequestLatency_P95 |
Millisecondes | Average | deployment |
PT1M | Oui |
Trafic | Latence de requête P99 Latence moyenne de requête P99 agrégée par toutes les valeurs de latence de requête collectées sur la période sélectionnée |
RequestLatency_P99 |
Millisecondes | Average | deployment |
PT1M | Oui |
Trafic | Requêtes par minute Nombre de requêtes envoyées au point de terminaison en ligne par minute |
RequestsPerMinute |
Count | Average | deployment , , statusCode statusCodeClass , ,modelStatusCode |
PT1M | Non |