Unterstützte Metriken für Microsoft.MachineLearningServices/workspaces/onlineEndpoints/deployments
In der folgenden Tabelle sind die Metriken aufgeführt, die für den Ressourcentyp "Microsoft.MachineLearningServices/workspaces/onlineEndpoints/deployments" verfügbar sind.
Tabellenüberschriften
Metrik – Der Anzeigename der Metrik, wie er im Azure-Portal angezeigt wird.
Name in der Rest-API – Metrischer Name, wie in der REST-API bezeichnet.
Einheit – Abrechnungseinheit.
Aggregation – Der Standard-Aggregationstyp. Gültige Werte: Mittelwert, Minimum, Maximum, Gesamt, Anzahl.
Dimensionen - Für die Metrik verfügbare Dimensionen.
Aggregationsintervall - Intervalle, in denen die Metrik gesampelt wird. PT1M
bedeutet zum Beispiel, dass die Metrik jede Minute abgerufen wird, PT30M
alle 30 Minuten, PT1H
jede Stunde usw.
DS-Export – Gibt an, ob die Metrik über Diagnose-Einstellungen in Azure Monitor-Protokolle exportiert werden kann.
Informationen zum Exportieren von Metriken finden Sie unter " Metrikexport mithilfe von Datensammlungsregeln und Erstellen von Diagnoseeinstellungen in Azure Monitor.
Informationen zur Aufbewahrung von Metriken finden Sie unter Überblick über Metriken in Azure Monitor.
Kategorie: Ressource
Metrik | Name in der REST-API | Einheit | Aggregation | Dimensionen | Aggregationsintervalle | DS-Export |
---|---|---|---|---|---|---|
Prozentuale CPU-Speicherauslastung Prozentuale Arbeitsspeicherauslastung auf einer Instanz. die Auslastung wird in Intervallen von einer Minute gemeldet. |
CpuMemoryUtilizationPercentage |
Percent | Minimum, Maximum, Mittelwert | instanceId |
PT1M | Ja |
Prozentsatz der CPU-Auslastung Prozentuale CPU-Auslastung auf einer Instanz. die Auslastung wird in Intervallen von einer Minute gemeldet. |
CpuUtilizationPercentage |
Percent | Minimum, Maximum, Mittelwert | instanceId |
PT1M | Ja |
Datensammlungsfehler pro Minute Die Anzahl der verworfenen Datensammlungsereignisse pro Minute. |
DataCollectionErrorsPerMinute |
Anzahl | Minimum, Maximum, Mittelwert | instanceId , reason type |
PT1M | No |
Datensammlungsereignisse pro Minute Die Anzahl der verarbeiteten Datensammlungsereignisse pro Minute. |
DataCollectionEventsPerMinute |
Anzahl | Minimum, Maximum, Mittelwert | instanceId , type |
PT1M | No |
Bereitstellungskapazität Die Anzahl der Instanzen in der Bereitstellung. |
DeploymentCapacity |
Anzahl | Minimum, Maximum, Mittelwert | instanceId , State |
PT1M | No |
Datenträgerauslastung Prozentuale Datenträgerauslastung auf einer Instanz. die Auslastung wird in Intervallen von einer Minute gemeldet. |
DiskUtilization |
Percent | Minimum, Maximum, Mittelwert | instanceId , disk |
PT1M | Ja |
GPU-Energie in Joule Intervallenergie in Joule auf einem GPU-Knoten. Die Energie wird in Intervallen von einer Minute gemeldet. |
GpuEnergyJoules |
Anzahl | Minimum, Maximum, Mittelwert | instanceId |
PT1M | No |
Prozentuale GPU-Speicherauslastung Prozentuale GPU-Speicherauslastung auf einer Instanz. die Auslastung wird in Intervallen von einer Minute gemeldet. |
GpuMemoryUtilizationPercentage |
Percent | Minimum, Maximum, Mittelwert | instanceId |
PT1M | Ja |
Prozentuale GPU-Auslastung Prozentuale GPU-Auslastung auf einer Instanz. die Auslastung wird in Intervallen von einer Minute gemeldet. |
GpuUtilizationPercentage |
Percent | Minimum, Maximum, Mittelwert | instanceId |
PT1M | Ja |
Kategorie: Datenverkehr
Metrik | Name in der REST-API | Einheit | Aggregation | Dimensionen | Aggregationsintervalle | DS-Export |
---|---|---|---|---|---|---|
Anforderungswartezeit P50 Die durchschnittliche P50-Anforderungswartezeit, die sich aus allen über den ausgewählten Zeitraum erfassten Werten für die Anforderungswartezeit zusammensetzt |
RequestLatency_P50 |
Millisekunden | Average | <none> | PT1M | Ja |
Anforderungswartezeit P90 Die durchschnittliche P90-Anforderungswartezeit, die sich aus allen über den ausgewählten Zeitraum erfassten Werten für die Anforderungswartezeit zusammensetzt |
RequestLatency_P90 |
Millisekunden | Average | <none> | PT1M | Ja |
Anforderungswartezeit P95 Die durchschnittliche P95-Anforderungswartezeit, die sich aus allen über den ausgewählten Zeitraum erfassten Werten für die Anforderungswartezeit zusammensetzt |
RequestLatency_P95 |
Millisekunden | Average | <none> | PT1M | Ja |
Anforderungswartezeit P99 Die durchschnittliche P99-Anforderungswartezeit, die sich aus allen über den ausgewählten Zeitraum erfassten Werten für die Anforderungswartezeit zusammensetzt |
RequestLatency_P99 |
Millisekunden | Average | <none> | PT1M | Ja |
Anforderungen pro Minute Die Anzahl der Anforderungen, die innerhalb einer Minute an die Onlinebereitstellung gesendet wurden |
RequestsPerMinute |
Anzahl | Average | envoy_response_code |
PT1M | No |