Freigeben über


Unterstützte Metriken für Microsoft.MachineLearningServices/workspaces/onlineEndpoints/deployments

In der folgenden Tabelle sind die Metriken aufgeführt, die für den Ressourcentyp "Microsoft.MachineLearningServices/workspaces/onlineEndpoints/deployments" verfügbar sind.

Tabellenüberschriften

Metrik – Der Anzeigename der Metrik, wie er im Azure-Portal angezeigt wird.
Name in der Rest-API – Metrischer Name, wie in der REST-API bezeichnet.
Einheit – Abrechnungseinheit.
Aggregation – Der Standard-Aggregationstyp. Gültige Werte: Mittelwert, Minimum, Maximum, Gesamt, Anzahl.
Dimensionen - Für die Metrik verfügbare Dimensionen.
Aggregationsintervall - Intervalle, in denen die Metrik gesampelt wird. PT1M bedeutet zum Beispiel, dass die Metrik jede Minute abgerufen wird, PT30M alle 30 Minuten, PT1H jede Stunde usw.
DS-Export – Gibt an, ob die Metrik über Diagnose-Einstellungen in Azure Monitor-Protokolle exportiert werden kann.

Informationen zum Exportieren von Metriken finden Sie unter " Metrikexport mithilfe von Datensammlungsregeln und Erstellen von Diagnoseeinstellungen in Azure Monitor.

Informationen zur Aufbewahrung von Metriken finden Sie unter Überblick über Metriken in Azure Monitor.

Kategorie: Ressource

Metrik Name in der REST-API Einheit Aggregation Dimensionen Aggregationsintervalle DS-Export
Prozentuale CPU-Speicherauslastung

Prozentuale Arbeitsspeicherauslastung auf einer Instanz. die Auslastung wird in Intervallen von einer Minute gemeldet.
CpuMemoryUtilizationPercentage Percent Minimum, Maximum, Mittelwert instanceId PT1M Ja
Prozentsatz der CPU-Auslastung

Prozentuale CPU-Auslastung auf einer Instanz. die Auslastung wird in Intervallen von einer Minute gemeldet.
CpuUtilizationPercentage Percent Minimum, Maximum, Mittelwert instanceId PT1M Ja
Datensammlungsfehler pro Minute

Die Anzahl der verworfenen Datensammlungsereignisse pro Minute.
DataCollectionErrorsPerMinute Anzahl Minimum, Maximum, Mittelwert instanceId, reasontype PT1M No
Datensammlungsereignisse pro Minute

Die Anzahl der verarbeiteten Datensammlungsereignisse pro Minute.
DataCollectionEventsPerMinute Anzahl Minimum, Maximum, Mittelwert instanceId, type PT1M No
Bereitstellungskapazität

Die Anzahl der Instanzen in der Bereitstellung.
DeploymentCapacity Anzahl Minimum, Maximum, Mittelwert instanceId, State PT1M No
Datenträgerauslastung

Prozentuale Datenträgerauslastung auf einer Instanz. die Auslastung wird in Intervallen von einer Minute gemeldet.
DiskUtilization Percent Minimum, Maximum, Mittelwert instanceId, disk PT1M Ja
GPU-Energie in Joule

Intervallenergie in Joule auf einem GPU-Knoten. Die Energie wird in Intervallen von einer Minute gemeldet.
GpuEnergyJoules Anzahl Minimum, Maximum, Mittelwert instanceId PT1M No
Prozentuale GPU-Speicherauslastung

Prozentuale GPU-Speicherauslastung auf einer Instanz. die Auslastung wird in Intervallen von einer Minute gemeldet.
GpuMemoryUtilizationPercentage Percent Minimum, Maximum, Mittelwert instanceId PT1M Ja
Prozentuale GPU-Auslastung

Prozentuale GPU-Auslastung auf einer Instanz. die Auslastung wird in Intervallen von einer Minute gemeldet.
GpuUtilizationPercentage Percent Minimum, Maximum, Mittelwert instanceId PT1M Ja

Kategorie: Datenverkehr

Metrik Name in der REST-API Einheit Aggregation Dimensionen Aggregationsintervalle DS-Export
Anforderungswartezeit P50

Die durchschnittliche P50-Anforderungswartezeit, die sich aus allen über den ausgewählten Zeitraum erfassten Werten für die Anforderungswartezeit zusammensetzt
RequestLatency_P50 Millisekunden Average <none> PT1M Ja
Anforderungswartezeit P90

Die durchschnittliche P90-Anforderungswartezeit, die sich aus allen über den ausgewählten Zeitraum erfassten Werten für die Anforderungswartezeit zusammensetzt
RequestLatency_P90 Millisekunden Average <none> PT1M Ja
Anforderungswartezeit P95

Die durchschnittliche P95-Anforderungswartezeit, die sich aus allen über den ausgewählten Zeitraum erfassten Werten für die Anforderungswartezeit zusammensetzt
RequestLatency_P95 Millisekunden Average <none> PT1M Ja
Anforderungswartezeit P99

Die durchschnittliche P99-Anforderungswartezeit, die sich aus allen über den ausgewählten Zeitraum erfassten Werten für die Anforderungswartezeit zusammensetzt
RequestLatency_P99 Millisekunden Average <none> PT1M Ja
Anforderungen pro Minute

Die Anzahl der Anforderungen, die innerhalb einer Minute an die Onlinebereitstellung gesendet wurden
RequestsPerMinute Anzahl Average envoy_response_code PT1M No

Nächste Schritte