Metriche supportate per Microsoft.MachineLearningServices/workspaces/onlineEndpoints
La tabella seguente elenca le metriche disponibili per il tipo di risorsa Microsoft.MachineLearningServices/workspaces/onlineEndpoints.
Intestazioni di tabella
Metrica: nome visualizzato della metrica come visualizzato nella portale di Azure.
Nome nell'API REST : nome della metrica, come indicato nell'API REST.
Unità: Unità di misura.
Aggregazione: tipo di aggregazione predefinito. Valori validi: Average, Minimum, Maximum, Total, Count.
Dimensioni - Dimensioni disponibili per la metrica.
Intervalli di tempo - Intervalli in cui viene campionata la metrica. Ad esempio, PT1M
indica che la metrica viene campionata ogni minuto, PT30M
ogni 30 minuti, PT1H
ogni ora e così via.
Esportazione DS: indica se la metrica è esportabile nei log di Monitoraggio di Azure tramite le impostazioni di diagnostica.
Per informazioni sull'esportazione delle metriche, vedere - Esportazione delle metriche usando le regole di raccolta dati e Creare impostazioni di diagnostica in Monitoraggio di Azure.
Per informazioni sulla conservazione delle metriche, vedere Informazioni generali sulle metriche del Monitoraggio di Azure.
Per un elenco dei log supportati, vedere Categorie di log supportate - Microsoft.MachineLearningServices/workspaces/onlineEndpoints
Categoria | Metric | Nome nell'API REST | Unità | Aggregazione | Dimensioni | Intervalli di tempo | Esportazione DS |
---|---|---|---|---|---|---|---|
Traffico | Connessioni attive Numero totale di connessioni TCP simultanee attive dai client. |
ConnectionsActive |
Conteggio | Media | <none> | PT1M | No |
Traffico | Errori di raccolta dati al minuto Numero di eventi di raccolta dati eliminati al minuto. |
DataCollectionErrorsPerMinute |
Conteggio | Minimo, Massimo, Medio | deployment , reason , type |
PT1M | No |
Traffico | Eventi di raccolta dati al minuto Numero di eventi di raccolta dati elaborati al minuto. |
DataCollectionEventsPerMinute |
Conteggio | Minimo, Massimo, Medio | deployment , type |
PT1M | No |
Traffico | Byte di rete Byte al secondo serviti per l'endpoint. |
NetworkBytes |
Byte al secondo | Media | <none> | PT1M | No |
Traffico | Nuove connessioni al secondo Numero medio di nuove connessioni TCP al secondo stabilite dai client. |
NewConnectionsPerSecond |
Conteggio al secondo | Media | <none> | PT1M | No |
Traffico | Latenza delle richieste Intervallo di tempo completo impiegato in media per rispondere a una richiesta in millisecondi |
RequestLatency |
Millisecondi | Media | deployment |
PT1M | Sì |
Traffico | Latenza delle richieste P50 Latenza media della richiesta P50 aggregata da tutti i valori di latenza delle richieste raccolti nel periodo di tempo selezionato |
RequestLatency_P50 |
Millisecondi | Media | deployment |
PT1M | Sì |
Traffico | Latenza delle richieste P90 Latenza media della richiesta P90 aggregata da tutti i valori di latenza delle richieste raccolti nel periodo di tempo selezionato |
RequestLatency_P90 |
Millisecondi | Media | deployment |
PT1M | Sì |
Traffico | Latenza delle richieste P95 Latenza media della richiesta P95 aggregata da tutti i valori di latenza delle richieste raccolti nel periodo di tempo selezionato |
RequestLatency_P95 |
Millisecondi | Media | deployment |
PT1M | Sì |
Traffico | Latenza delle richieste P99 Latenza media della richiesta P99 aggregata da tutti i valori di latenza delle richieste raccolti nel periodo di tempo selezionato |
RequestLatency_P99 |
Millisecondi | Media | deployment |
PT1M | Sì |
Traffico | Richieste al minuto Numero di richieste inviate all'endpoint online entro un minuto |
RequestsPerMinute |
Conteggio | Media | deployment , statusCode , statusCodeClass modelStatusCode |
PT1M | No |