Überwachen von Azure Machine Learning-Daten – Referenz
Dieser Artikel enthält alle Referenzinformationen zur Überwachung dieses Dienstes.
Ausführliche Informationen zu den Daten, die Sie für Azure Machine Learning sammeln können, und deren Verwendung finden Sie unter Monitor Machine Learning .
Metriken
In diesem Abschnitt werden alle automatisch erfassten Plattformmetriken für diesen Dienst aufgeführt. Diese Metriken sind auch Teil der globalen Liste aller in Azure Monitor unterstützten Plattformmetriken.
Informationen zur Aufbewahrung von Metriken finden Sie unter Überblick über Metriken in Azure Monitor.
Der Ressourcenanbieter für diese Metriken ist Microsoft.MachineLearningServices/workspaces.
Die Metrikkategorien sind "Modell", "Kontingent", "Ressource", "Ausführen" und "Datenverkehr". Kontingentinformationen sind nur für maschinelles Lernen vorgesehen. Run enthält Informationen zu Schulungsläufen für den Arbeitsbereich.
Unterstützte Metriken für Microsoft.MachineLearningServices/Arbeitsbereiche
In der folgenden Tabelle sind die Metriken aufgeführt, die für den Ressourcentyp "Microsoft.MachineLearningServices/workspaces" verfügbar sind.
- Möglicherweise sind nicht alle Spalten in jeder Tabelle vorhanden.
- Einige Spalten können über den Anzeigebereich der Seite hinausgehen. Wählen Sie Tabelle erweitern aus, um alle verfügbaren Spalten anzuzeigen.
Tabellenüberschriften
- Kategorie – Die Metrikgruppe oder -klassifizierung.
- Metrik – Der Anzeigename der Metrik, wie er im Azure-Portal angezeigt wird.
- Name in REST-API: Der Metrikname im REST-API
- Einheit – Abrechnungseinheit.
- Aggregation – Der Standard-Aggregationstyp. Gültige Werte: Mittelwert (Avg), Minimum (Min), Maximum (Max), Gesamt (Sum), Anzahl
- Dimensionen - Für die Metrik verfügbare Dimensionen.
- Aggregationsintervall - Intervalle, in denen die Metrik gesampelt wird.
PT1M
bedeutet zum Beispiel, dass die Metrik jede Minute abgerufen wird,PT30M
alle 30 Minuten,PT1H
jede Stunde usw. - DS-Export – Gibt an, ob die Metrik über Diagnose-Einstellungen in Azure Monitor-Protokolle exportiert werden kann. Informationen zum Exportieren von Metriken finden Sie unter Diagnoseeinstellungen in Azure Monitor erstellen.
Kategorie | Metrik | Name in der REST-API | Einheit | Aggregation | Dimensionen | Aggregationsintervalle | DS-Export |
---|---|---|---|---|---|---|---|
Kontingent | Aktive Kerne Gesamtanzahl der aktiven Kerne |
Active Cores |
Count | Durchschnitt, Maximum, Minimum, Gesamt (Summe) | Scenario , ClusterName |
PT1M | Ja |
Kontingent | Aktive Knoten Anzahl der aktiven Knoten. Dabei handelt es sich um die Knoten, auf denen aktiv ein Auftrag ausgeführt wird. |
Active Nodes |
Count | Durchschnitt, Maximum, Minimum, Gesamt (Summe) | Scenario , ClusterName |
PT1M | Ja |
Ausführung | Angeforderte Ausführung abbrechen Anzahl von Ausführungen, bei denen ein Abbruch für diesen Arbeitsbereich angefordert wurde – die Anzahl wird aktualisiert, wenn eine Abbruchanforderung für eine Ausführung empfangen wurde. |
Cancel Requested Runs |
Count | Summe (Summe), Mittelwert, Minimum, Maximum, Anzahl | Scenario , , RunType PublishedPipelineId , ComputeType , , PipelineStepType ExperimentName |
PT1M | Ja |
Ausführung | Abgebrochene Ausführungen Anzahl abgebrochener Ausführungen für diesen Arbeitsbereich – die Anzahl wird aktualisiert, wenn eine Ausführung erfolgreich abgebrochen wurde. |
Cancelled Runs |
Count | Summe (Summe), Mittelwert, Minimum, Maximum, Anzahl | Scenario , , RunType PublishedPipelineId , ComputeType , , PipelineStepType ExperimentName |
PT1M | Ja |
Ausführung | Abgeschlossene Ausführung Anzahl erfolgreich abgeschlossener Ausführungen für diesen Arbeitsbereich – die Anzahl wird aktualisiert, wenn eine Ausführung abgeschlossen und die Ausgabe erfasst wurde. |
Completed Runs |
Count | Summe (Summe), Mittelwert, Minimum, Maximum, Anzahl | Scenario , , RunType PublishedPipelineId , ComputeType , , PipelineStepType ExperimentName |
PT1M | Ja |
Resource | CpuCapacityMillicores Maximale Kapazität eines CPU-Knotens in Millicore. Die Kapazität wird in Intervallen von einer Minute aggregiert. |
CpuCapacityMillicores |
Count | Durchschnitt, Maximum, Minimum, Gesamt (Summe) | RunId , InstanceId ComputeName |
PT1M | Ja |
Resource | CpuMemoryCapacityMegabytes Maximale Arbeitsspeicherauslastung eines CPU-Knotens in Megabyte. Die Auslastung wird in Intervallen von einer Minute aggregiert. |
CpuMemoryCapacityMegabytes |
Count | Durchschnitt, Maximum, Minimum, Gesamt (Summe) | RunId , InstanceId ComputeName |
PT1M | Ja |
Resource | CpuMemoryUtilizationMegabytes Arbeitsspeicherauslastung eines CPU-Knotens in Megabyte. Die Auslastung wird in Intervallen von einer Minute aggregiert. |
CpuMemoryUtilizationMegabytes |
Count | Durchschnitt, Maximum, Minimum, Gesamt (Summe) | RunId , InstanceId ComputeName |
PT1M | Ja |
Resource | CpuMemoryUtilizationPercentage Arbeitsspeicherauslastung eines CPU-Knotens in Prozent. Die Auslastung wird in Intervallen von einer Minute aggregiert. |
CpuMemoryUtilizationPercentage |
Count | Durchschnitt, Maximum, Minimum, Gesamt (Summe) | RunId , InstanceId ComputeName |
PT1M | Ja |
Resource | CpuUtilization Prozentsatz der Auslastung auf einem CPU-Knoten. die Auslastung wird in Intervallen von einer Minute gemeldet. |
CpuUtilization |
Count | Durchschnitt, Maximum, Minimum, Gesamt (Summe) | Scenario , , runId NodeId ClusterName |
PT1M | Ja |
Resource | CpuUtilizationMillicores Auslastung eines CPU-Knotens in Millicore. Die Auslastung wird in Intervallen von einer Minute aggregiert. |
CpuUtilizationMillicores |
Count | Durchschnitt, Maximum, Minimum, Gesamt (Summe) | RunId , InstanceId ComputeName |
PT1M | Ja |
Resource | CpuUtilizationPercentage Auslastung eines CPU-Knotens in Prozent. Die Auslastung wird in Intervallen von einer Minute aggregiert. |
CpuUtilizationPercentage |
Count | Durchschnitt, Maximum, Minimum, Gesamt (Summe) | RunId , InstanceId ComputeName |
PT1M | Ja |
Resource | DiskAvailMegabytes Verfügbarer Speicherplatz auf dem Datenträger in MB. Die Metriken werden in Intervallen von einer Minute aggregiert. |
DiskAvailMegabytes |
Count | Durchschnitt, Maximum, Minimum, Gesamt (Summe) | RunId , InstanceId ComputeName |
PT1M | Ja |
Resource | DiskReadMegabytes Vom Datenträger gelesene Daten in MB. Die Metriken werden in Intervallen von einer Minute aggregiert. |
DiskReadMegabytes |
Count | Durchschnitt, Maximum, Minimum, Gesamt (Summe) | RunId , InstanceId ComputeName |
PT1M | Ja |
Resource | DiskUsedMegabytes Verwendeter Speicherplatz auf dem Datenträger in MB. Die Metriken werden in Intervallen von einer Minute aggregiert. |
DiskUsedMegabytes |
Count | Durchschnitt, Maximum, Minimum, Gesamt (Summe) | RunId , InstanceId ComputeName |
PT1M | Ja |
Resource | DiskWriteMegabytes Auf den Datenträger geschriebene Daten in MB. Die Metriken werden in Intervallen von einer Minute aggregiert. |
DiskWriteMegabytes |
Count | Durchschnitt, Maximum, Minimum, Gesamt (Summe) | RunId , InstanceId ComputeName |
PT1M | Ja |
Ausführung | Fehler Anzahl von Ausführungsfehlern in diesem Arbeitsbereich – die Anzahl wird aktualisiert, wenn bei der Ausführung ein Fehler auftritt. |
Errors |
Count | Summe (Summe), Mittelwert, Minimum, Maximum, Anzahl | Scenario |
PT1M | Ja |
Ausführung | Fehlerhafte Ausführungen Anzahl fehlerhafter Ausführungen für diesen Arbeitsbereich – die Anzahl wird aktualisiert, wenn bei einer Ausführung ein Fehler auftritt. |
Failed Runs |
Count | Summe (Summe), Mittelwert, Minimum, Maximum, Anzahl | Scenario , , RunType PublishedPipelineId , ComputeType , , PipelineStepType ExperimentName |
PT1M | Ja |
Ausführung | Abschließen von Ausführungen Anzahl von Ausführungen, die für diesen Arbeitsbereich abgeschlossen wurden – die Anzahl wird aktualisiert, wenn eine Ausführung abgeschlossen wurde, aber die Ausgabe noch erfasst wird. |
Finalizing Runs |
Count | Summe (Summe), Mittelwert, Minimum, Maximum, Anzahl | Scenario , , RunType PublishedPipelineId , ComputeType , , PipelineStepType ExperimentName |
PT1M | Ja |
Resource | GpuCapacityMilliGPUs Maximale Kapazität eines GPU-Geräts in Milli-GPU. Die Kapazität wird in Intervallen von einer Minute aggregiert. |
GpuCapacityMilliGPUs |
Count | Durchschnitt, Maximum, Minimum, Gesamt (Summe) | RunId , , InstanceId DeviceId ComputeName |
PT1M | Ja |
Resource | GpuEnergieJoules Intervallenergie in Joule auf einem GPU-Knoten. Die Energie wird in Intervallen von einer Minute gemeldet. |
GpuEnergyJoules |
Count | Durchschnitt, Maximum, Minimum, Gesamt (Summe) | Scenario , , runId rootRunId , InstanceId , , DeviceId ComputeName |
PT1M | Ja |
Resource | GpuMemoryCapacityMegabytes Maximale Speicherkapazität eines GPU-Geräts in Megabyte. Die Kapazität wird in Intervallen von einer Minute aggregiert. |
GpuMemoryCapacityMegabytes |
Count | Durchschnitt, Maximum, Minimum, Gesamt (Summe) | RunId , , InstanceId DeviceId ComputeName |
PT1M | Ja |
Resource | GpuMemoryUtilization Arbeitsspeicherauslastung auf einem GPU-Knoten in Prozent – die Auslastung wird in Intervallen von einer Minute gemeldet. |
GpuMemoryUtilization |
Count | Durchschnitt, Maximum, Minimum, Gesamt (Summe) | Scenario , , runId NodeId , , DeviceId ClusterName |
PT1M | Ja |
Resource | GpuMemoryUtilizationMegabytes Arbeitsspeicherauslastung eines GPU-Geräts in Megabyte. Die Auslastung wird in Intervallen von einer Minute aggregiert. |
GpuMemoryUtilizationMegabytes |
Count | Durchschnitt, Maximum, Minimum, Gesamt (Summe) | RunId , , InstanceId DeviceId ComputeName |
PT1M | Ja |
Resource | GpuMemoryUtilizationPercentage Arbeitsspeicherauslastung eines GPU-Geräts in Prozent. Die Auslastung wird in Intervallen von einer Minute aggregiert. |
GpuMemoryUtilizationPercentage |
Count | Durchschnitt, Maximum, Minimum, Gesamt (Summe) | RunId , , InstanceId DeviceId ComputeName |
PT1M | Ja |
Resource | GpuUtilization Prozentsatz der Auslastung auf einem GPU-Knoten. die Auslastung wird in Intervallen von einer Minute gemeldet. |
GpuUtilization |
Count | Durchschnitt, Maximum, Minimum, Gesamt (Summe) | Scenario , , runId NodeId , , DeviceId ClusterName |
PT1M | Ja |
Resource | GpuUtilizationMilliGPUs Auslastung eines GPU-Geräts in Milli-GPU. Die Auslastung wird in Intervallen von einer Minute aggregiert. |
GpuUtilizationMilliGPUs |
Count | Durchschnitt, Maximum, Minimum, Gesamt (Summe) | RunId , , InstanceId DeviceId ComputeName |
PT1M | Ja |
Resource | GpuUtilizationPercentage Auslastung eines GPU-Geräts in Prozent. Die Auslastung wird in Intervallen von einer Minute aggregiert. |
GpuUtilizationPercentage |
Count | Durchschnitt, Maximum, Minimum, Gesamt (Summe) | RunId , , InstanceId DeviceId ComputeName |
PT1M | Ja |
Resource | IBReceiveMegabytes Über InfiniBand empfangene Netzwerkdaten in Megabyte. Die Metriken werden in Intervallen von einer Minute aggregiert. |
IBReceiveMegabytes |
Count | Durchschnitt, Maximum, Minimum, Gesamt (Summe) | RunId , , InstanceId ComputeName DeviceId |
PT1M | Ja |
Resource | IBTransmitMegabytes Über InfiniBand gesendete Netzwerkdaten in Megabyte. Die Metriken werden in Intervallen von einer Minute aggregiert. |
IBTransmitMegabytes |
Count | Durchschnitt, Maximum, Minimum, Gesamt (Summe) | RunId , , InstanceId ComputeName DeviceId |
PT1M | Ja |
Kontingent | Leerlaufkerne Gesamtanzahl der Kerne im Leerlauf |
Idle Cores |
Count | Durchschnitt, Maximum, Minimum, Gesamt (Summe) | Scenario , ClusterName |
PT1M | Ja |
Kontingent | Leerlaufknoten Anzahl von Knoten im Leerlauf. Knoten im Leerlauf sind die Knoten, auf denen keine Aufträge ausgeführt werden, die aber einen neuen Auftrag bei Verfügbarkeit akzeptieren können. |
Idle Nodes |
Count | Durchschnitt, Maximum, Minimum, Gesamt (Summe) | Scenario , ClusterName |
PT1M | Ja |
Kontingent | Kerne verlassen Anzahl der ausscheidenden Kerne |
Leaving Cores |
Count | Durchschnitt, Maximum, Minimum, Gesamt (Summe) | Scenario , ClusterName |
PT1M | Ja |
Kontingent | Knoten verlassen Anzahl der ausscheidenden Knoten. Ausscheidende Knoten sind die Knoten, auf denen die Verarbeitung eines Auftrags gerade abgeschlossen wurde und die in den Leerlaufzustand wechseln. |
Leaving Nodes |
Count | Durchschnitt, Maximum, Minimum, Gesamt (Summe) | Scenario , ClusterName |
PT1M | Ja |
Modell | Fehler bei der Modellbereitstellung Anzahl der fehlerhaften Modellimplementierungen in diesem Arbeitsbereich |
Model Deploy Failed |
Count | Summe (Summe), Mittelwert, Minimum, Maximum, Anzahl | Scenario , StatusCode |
PT1M | Ja |
Modell | Modellbereitstellung gestartet Anzahl der gestarteten Modellimplementierungen in diesem Arbeitsbereich |
Model Deploy Started |
Count | Summe (Summe), Mittelwert, Minimum, Maximum, Anzahl | Scenario |
PT1M | Ja |
Modell | Modellbereitstellung erfolgreich Anzahl der erfolgreichen Modellimplementierungen in diesem Arbeitsbereich |
Model Deploy Succeeded |
Count | Summe (Summe), Mittelwert, Minimum, Maximum, Anzahl | Scenario |
PT1M | Ja |
Modell | Fehler bei der Modellregisterung Anzahl der fehlerhaften Modellregistrierungen in diesem Arbeitsbereich |
Model Register Failed |
Count | Summe (Summe), Mittelwert, Minimum, Maximum, Anzahl | Scenario , StatusCode |
PT1M | Ja |
Modell | Modellregister erfolgreich Anzahl der erfolgreichen Modellregistrierungen in diesem Arbeitsbereich |
Model Register Succeeded |
Count | Summe (Summe), Mittelwert, Minimum, Maximum, Anzahl | Scenario |
PT1M | Ja |
Resource | NetworkInputMegabytes Empfangene Netzwerkdaten in Megabyte. Die Metriken werden in Intervallen von einer Minute aggregiert. |
NetworkInputMegabytes |
Count | Durchschnitt, Maximum, Minimum, Gesamt (Summe) | RunId , , InstanceId ComputeName DeviceId |
PT1M | Ja |
Resource | NetworkOutputMegabytes Gesendete Netzwerkdaten in Megabyte. Die Metriken werden in Intervallen von einer Minute aggregiert. |
NetworkOutputMegabytes |
Count | Durchschnitt, Maximum, Minimum, Gesamt (Summe) | RunId , , InstanceId ComputeName DeviceId |
PT1M | Ja |
Ausführung | Ausführung nicht reagiert Anzahl nicht reagierender Ausführungen für diesen Arbeitsbereich – die Anzahl wird aktualisiert, wenn eine Ausführung zum Status „Keine Rückmeldung“ übergeht. |
Not Responding Runs |
Count | Summe (Summe), Mittelwert, Minimum, Maximum, Anzahl | Scenario , , RunType PublishedPipelineId , ComputeType , , PipelineStepType ExperimentName |
PT1M | Ja |
Ausführung | Nicht gestartete Ausführung Anzahl von Ausführungen mit Status „Nicht gestartet“ für diesen Arbeitsbereich – die Anzahl wird aktualisiert, wenn eine Anforderung zur Initiierung einer Ausführung eingeht, aber die Ausführungsinformationen nicht aufgefüllt wurden. |
Not Started Runs |
Count | Summe (Summe), Mittelwert, Minimum, Maximum, Anzahl | Scenario , , RunType PublishedPipelineId , ComputeType , , PipelineStepType ExperimentName |
PT1M | Ja |
Kontingent | Preempted Cores Anzahl der vorzeitig entfernten Kerne |
Preempted Cores |
Count | Durchschnitt, Maximum, Minimum, Gesamt (Summe) | Scenario , ClusterName |
PT1M | Ja |
Kontingent | Preempted Nodes Anzahl der vorzeitig entfernten Knoten. Dabei handelt es sich um die Knoten mit niedriger Priorität, die aus dem Pool verfügbarer Knoten entfernt werden. |
Preempted Nodes |
Count | Durchschnitt, Maximum, Minimum, Gesamt (Summe) | Scenario , ClusterName |
PT1M | Ja |
Ausführung | Vorbereiten von Ausführungen Anzahl von Ausführungen, die für diesen Arbeitsbereich vorbereitet werden – die Anzahl wird aktualisiert, wenn eine Ausführung in den Status „Wird vorbereitet“ übergeht, während die Ausführungsumgebung vorbereitet wird. |
Preparing Runs |
Count | Summe (Summe), Mittelwert, Minimum, Maximum, Anzahl | Scenario , , RunType PublishedPipelineId , ComputeType , , PipelineStepType ExperimentName |
PT1M | Ja |
Ausführung | Bereitstellungsausführungen Anzahl von Ausführungen, die sich für diesen Arbeitsbereich in Bereitstellung befinden – die Anzahl wird aktualisiert, wenn eine Ausführung darauf wartet, dass ein Computeziel erstellt oder bereitgestellt wird. |
Provisioning Runs |
Count | Summe (Summe), Mittelwert, Minimum, Maximum, Anzahl | Scenario , , RunType PublishedPipelineId , ComputeType , , PipelineStepType ExperimentName |
PT1M | Ja |
Ausführung | In die Warteschlange eingereihte Läufe Anzahl von Ausführungen, die sich für diesen Arbeitsbereich in der Warteschlange befinden – die Anzahl wird aktualisiert, wenn eine Ausführung im Computeziel in die Warteschlange eingereiht wird. Dieser Fall kann eintreten, wenn darauf gewartet wird, dass erforderliche Computeknoten bereit sind. |
Queued Runs |
Count | Summe (Summe), Mittelwert, Minimum, Maximum, Anzahl | Scenario , , RunType PublishedPipelineId , ComputeType , , PipelineStepType ExperimentName |
PT1M | Ja |
Kontingent | Prozentsatz der Kontingentauslastung Prozentualer Anteil der genutzten Kontingente |
Quota Utilization Percentage |
Count | Durchschnitt, Maximum, Minimum, Gesamt (Summe) | Scenario , , ClusterName VmFamilyName VmPriority |
PT1M | Ja |
Ausführung | Gestartete Ausführung Anzahl von Ausführungen für diesen Arbeitsbereich – die Anzahl wird aktualisiert, wenn eine Ausführung mit den erforderlichen Ressourcen gestartet wird. |
Started Runs |
Count | Summe (Summe), Mittelwert, Minimum, Maximum, Anzahl | Scenario , , RunType PublishedPipelineId , ComputeType , , PipelineStepType ExperimentName |
PT1M | Ja |
Ausführung | Startläufe Anzahl gestarteter Ausführungen für diesen Arbeitsbereich – die Anzahl wird aktualisiert, nachdem eine Anforderung zur Initiierung der Ausführung eingegangen ist und die Ausführungsinformationen (z. B. runId) aufgefüllt wurden. |
Starting Runs |
Count | Summe (Summe), Mittelwert, Minimum, Maximum, Anzahl | Scenario , , RunType PublishedPipelineId , ComputeType , , PipelineStepType ExperimentName |
PT1M | Ja |
Resource | StorageAPIFailureCount Fehleranzahl Azure Blob Storage-API-Aufrufe. |
StorageAPIFailureCount |
Count | Durchschnitt, Maximum, Minimum, Gesamt (Summe) | RunId , InstanceId ComputeName |
PT1M | Ja |
Resource | StorageAPISuccessCount Erfolgsanzahl Azure Blob Storage-API-Aufrufe. |
StorageAPISuccessCount |
Count | Durchschnitt, Maximum, Minimum, Gesamt (Summe) | RunId , InstanceId ComputeName |
PT1M | Ja |
Kontingent | Kerne insgesamt Gesamtanzahl von Kernen |
Total Cores |
Count | Durchschnitt, Maximum, Minimum, Gesamt (Summe) | Scenario , ClusterName |
PT1M | Ja |
Kontingent | Gesamtknoten Gesamtanzahl von Knoten. Diese Summe umfasst Teile von aktiven Knoten, Leerlaufknoten, nicht verwendbaren Knoten, vorab erstellten Knoten, ausscheidenden Knoten. |
Total Nodes |
Count | Durchschnitt, Maximum, Minimum, Gesamt (Summe) | Scenario , ClusterName |
PT1M | Ja |
Kontingent | Nicht verwendbare Kerne Anzahl der nicht verwendbaren Kerne |
Unusable Cores |
Count | Durchschnitt, Maximum, Minimum, Gesamt (Summe) | Scenario , ClusterName |
PT1M | Ja |
Kontingent | Nicht verwendbare Knoten Anzahl nicht verwendbarer Knoten. Nicht verwendbare Knoten sind aufgrund eines nicht auflösbaren Problems nicht funktionsfähig. Azure recycelt diese Knoten. |
Unusable Nodes |
Count | Durchschnitt, Maximum, Minimum, Gesamt (Summe) | Scenario , ClusterName |
PT1M | Ja |
Ausführung | Warnungen Anzahl von Ausführungswarnungen in diesem Arbeitsbereich – die Anzahl wird aktualisiert, wenn bei einer Ausführung eine Warnung auftritt. |
Warnings |
Count | Summe (Summe), Mittelwert, Minimum, Maximum, Anzahl | Scenario |
PT1M | Ja |
Unterstützte Metriken für Microsoft.MachineLearningServices/workspaces/onlineEndpoints
In der folgenden Tabelle sind die Metriken aufgeführt, die für den Ressourcentyp "Microsoft.MachineLearningServices/workspaces/onlineEndpoints" verfügbar sind.
- Möglicherweise sind nicht alle Spalten in jeder Tabelle vorhanden.
- Einige Spalten können über den Anzeigebereich der Seite hinausgehen. Wählen Sie Tabelle erweitern aus, um alle verfügbaren Spalten anzuzeigen.
Tabellenüberschriften
- Kategorie – Die Metrikgruppe oder -klassifizierung.
- Metrik – Der Anzeigename der Metrik, wie er im Azure-Portal angezeigt wird.
- Name in REST-API: Der Metrikname im REST-API
- Einheit – Abrechnungseinheit.
- Aggregation – Der Standard-Aggregationstyp. Gültige Werte: Mittelwert (Avg), Minimum (Min), Maximum (Max), Gesamt (Sum), Anzahl
- Dimensionen - Für die Metrik verfügbare Dimensionen.
- Aggregationsintervall - Intervalle, in denen die Metrik gesampelt wird.
PT1M
bedeutet zum Beispiel, dass die Metrik jede Minute abgerufen wird,PT30M
alle 30 Minuten,PT1H
jede Stunde usw. - DS-Export – Gibt an, ob die Metrik über Diagnose-Einstellungen in Azure Monitor-Protokolle exportiert werden kann. Informationen zum Exportieren von Metriken finden Sie unter Diagnoseeinstellungen in Azure Monitor erstellen.
Kategorie | Metrik | Name in der REST-API | Einheit | Aggregation | Dimensionen | Aggregationsintervalle | DS-Export |
---|---|---|---|---|---|---|---|
Verkehr | Aktive Verbindungen Die Gesamtanzahl der gleichzeitig aktiven TCP-Verbindungen von Clients. |
ConnectionsActive |
Anzahl | Average | <none> | PT1M | No |
Verkehr | Datensammlungsfehler pro Minute Die Anzahl der verworfenen Datensammlungsereignisse pro Minute. |
DataCollectionErrorsPerMinute |
Anzahl | Minimum, Maximum, Mittelwert | deployment , reason type |
PT1M | No |
Verkehr | Datensammlungsereignisse pro Minute Die Anzahl der verarbeiteten Datensammlungsereignisse pro Minute. |
DataCollectionEventsPerMinute |
Anzahl | Minimum, Maximum, Mittelwert | deployment , type |
PT1M | No |
Verkehr | Netzwerkbytes Die Bytes pro Sekunde, die für den Endpunkt bereitgestellt werden. |
NetworkBytes |
Bytes pro Sekunde | Average | <none> | PT1M | No |
Verkehr | Neue Verbindungen pro Sekunde Die durchschnittliche Anzahl neuer TCP-Verbindungen pro Sekunde, die von Clients hergestellt wurden. |
NewConnectionsPerSecond |
Anzahl pro Sekunde | Average | <none> | PT1M | No |
Verkehr | Anforderungswartezeit Das durchschnittliche vollständige Zeitintervall für die Beantwortung einer Anforderung in Millisekunden |
RequestLatency |
Millisekunden | Average | deployment |
PT1M | Ja |
Verkehr | Anforderungswartezeit P50 Die durchschnittliche P50-Anforderungswartezeit, die sich aus allen über den ausgewählten Zeitraum erfassten Werten für die Anforderungswartezeit zusammensetzt |
RequestLatency_P50 |
Millisekunden | Average | deployment |
PT1M | Ja |
Verkehr | Anforderungswartezeit P90 Die durchschnittliche P90-Anforderungswartezeit, die sich aus allen über den ausgewählten Zeitraum erfassten Werten für die Anforderungswartezeit zusammensetzt |
RequestLatency_P90 |
Millisekunden | Average | deployment |
PT1M | Ja |
Verkehr | Anforderungswartezeit P95 Die durchschnittliche P95-Anforderungswartezeit, die sich aus allen über den ausgewählten Zeitraum erfassten Werten für die Anforderungswartezeit zusammensetzt |
RequestLatency_P95 |
Millisekunden | Average | deployment |
PT1M | Ja |
Verkehr | Anforderungswartezeit P99 Die durchschnittliche P99-Anforderungswartezeit, die sich aus allen über den ausgewählten Zeitraum erfassten Werten für die Anforderungswartezeit zusammensetzt |
RequestLatency_P99 |
Millisekunden | Average | deployment |
PT1M | Ja |
Verkehr | Anforderungen pro Minute Die Anzahl der Anforderungen, die innerhalb einer Minute an den Onlineendpunkt gesendet wurden |
RequestsPerMinute |
Anzahl | Average | deployment , , statusCode statusCodeClass modelStatusCode |
PT1M | No |
Unterstützte Metriken für Microsoft.MachineLearningServices/workspaces/onlineEndpoints/deployments
In der folgenden Tabelle sind die Metriken aufgeführt, die für den Ressourcentyp "Microsoft.MachineLearningServices/workspaces/onlineEndpoints/deployments" verfügbar sind.
- Möglicherweise sind nicht alle Spalten in jeder Tabelle vorhanden.
- Einige Spalten können über den Anzeigebereich der Seite hinausgehen. Wählen Sie Tabelle erweitern aus, um alle verfügbaren Spalten anzuzeigen.
Tabellenüberschriften
- Kategorie – Die Metrikgruppe oder -klassifizierung.
- Metrik – Der Anzeigename der Metrik, wie er im Azure-Portal angezeigt wird.
- Name in REST-API: Der Metrikname im REST-API
- Einheit – Abrechnungseinheit.
- Aggregation – Der Standard-Aggregationstyp. Gültige Werte: Mittelwert (Avg), Minimum (Min), Maximum (Max), Gesamt (Sum), Anzahl
- Dimensionen - Für die Metrik verfügbare Dimensionen.
- Aggregationsintervall - Intervalle, in denen die Metrik gesampelt wird.
PT1M
bedeutet zum Beispiel, dass die Metrik jede Minute abgerufen wird,PT30M
alle 30 Minuten,PT1H
jede Stunde usw. - DS-Export – Gibt an, ob die Metrik über Diagnose-Einstellungen in Azure Monitor-Protokolle exportiert werden kann. Informationen zum Exportieren von Metriken finden Sie unter Diagnoseeinstellungen in Azure Monitor erstellen.
Kategorie | Metrik | Name in der REST-API | Einheit | Aggregation | Dimensionen | Aggregationsintervalle | DS-Export |
---|---|---|---|---|---|---|---|
Resource | Prozentuale CPU-Speicherauslastung Prozentuale Arbeitsspeicherauslastung auf einer Instanz. die Auslastung wird in Intervallen von einer Minute gemeldet. |
CpuMemoryUtilizationPercentage |
Percent | Minimum, Maximum, Mittelwert | instanceId |
PT1M | Ja |
Resource | Prozentsatz der CPU-Auslastung Prozentuale CPU-Auslastung auf einer Instanz. die Auslastung wird in Intervallen von einer Minute gemeldet. |
CpuUtilizationPercentage |
Percent | Minimum, Maximum, Mittelwert | instanceId |
PT1M | Ja |
Resource | Datensammlungsfehler pro Minute Die Anzahl der verworfenen Datensammlungsereignisse pro Minute. |
DataCollectionErrorsPerMinute |
Anzahl | Minimum, Maximum, Mittelwert | instanceId , reason type |
PT1M | No |
Resource | Datensammlungsereignisse pro Minute Die Anzahl der verarbeiteten Datensammlungsereignisse pro Minute. |
DataCollectionEventsPerMinute |
Anzahl | Minimum, Maximum, Mittelwert | instanceId , type |
PT1M | No |
Resource | Bereitstellungskapazität Die Anzahl der Instanzen in der Bereitstellung. |
DeploymentCapacity |
Anzahl | Minimum, Maximum, Mittelwert | instanceId , State |
PT1M | No |
Resource | Datenträgerauslastung Prozentuale Datenträgerauslastung auf einer Instanz. die Auslastung wird in Intervallen von einer Minute gemeldet. |
DiskUtilization |
Percent | Minimum, Maximum, Mittelwert | instanceId , disk |
PT1M | Ja |
Resource | GPU-Energie in Joule Intervallenergie in Joule auf einem GPU-Knoten. Die Energie wird in Intervallen von einer Minute gemeldet. |
GpuEnergyJoules |
Anzahl | Minimum, Maximum, Mittelwert | instanceId |
PT1M | No |
Resource | Prozentuale GPU-Speicherauslastung Prozentuale GPU-Speicherauslastung auf einer Instanz. die Auslastung wird in Intervallen von einer Minute gemeldet. |
GpuMemoryUtilizationPercentage |
Percent | Minimum, Maximum, Mittelwert | instanceId |
PT1M | Ja |
Resource | Prozentuale GPU-Auslastung Prozentuale GPU-Auslastung auf einer Instanz. die Auslastung wird in Intervallen von einer Minute gemeldet. |
GpuUtilizationPercentage |
Percent | Minimum, Maximum, Mittelwert | instanceId |
PT1M | Ja |
Verkehr | Anforderungswartezeit P50 Die durchschnittliche P50-Anforderungswartezeit, die sich aus allen über den ausgewählten Zeitraum erfassten Werten für die Anforderungswartezeit zusammensetzt |
RequestLatency_P50 |
Millisekunden | Average | <none> | PT1M | Ja |
Verkehr | Anforderungswartezeit P90 Die durchschnittliche P90-Anforderungswartezeit, die sich aus allen über den ausgewählten Zeitraum erfassten Werten für die Anforderungswartezeit zusammensetzt |
RequestLatency_P90 |
Millisekunden | Average | <none> | PT1M | Ja |
Verkehr | Anforderungswartezeit P95 Die durchschnittliche P95-Anforderungswartezeit, die sich aus allen über den ausgewählten Zeitraum erfassten Werten für die Anforderungswartezeit zusammensetzt |
RequestLatency_P95 |
Millisekunden | Average | <none> | PT1M | Ja |
Verkehr | Anforderungswartezeit P99 Die durchschnittliche P99-Anforderungswartezeit, die sich aus allen über den ausgewählten Zeitraum erfassten Werten für die Anforderungswartezeit zusammensetzt |
RequestLatency_P99 |
Millisekunden | Average | <none> | PT1M | Ja |
Verkehr | Anforderungen pro Minute Die Anzahl der Anforderungen, die innerhalb einer Minute an die Onlinebereitstellung gesendet wurden |
RequestsPerMinute |
Anzahl | Average | envoy_response_code |
PT1M | No |
Metrikdimensionen
Informationen darüber, was metrische Dimensionen sind, finden Sie unter Mehrdimensionale Metriken.
Bei diesem Dienst gelten die folgenden Dimensionen für die zugehörigen Metriken.
Dimension | Beschreibung |
---|---|
Clustername | Der Name der Computeclusterressource. Diese Dimension ist für alle Kontingentmetriken verfügbar. |
Vm Family Name (Name der VM-Familie) | Der Name der vom Cluster verwendeten VM-Familie Diese Dimension ist für die Metrik „Quota Utilization Percentage“ (Prozentsatz der Kontingentnutzung) verfügbar. |
Vm Priority (VM-Priorität) | Die Priorität des virtuellen Computers (VM) Diese Dimension ist für die Metrik „Quota Utilization Percentage“ (Prozentsatz der Kontingentnutzung) verfügbar. |
CreatedTime | Diese Dimension ist nur für CpuUtilization und GpuUtilization verfügbar. |
deviceId | ID des Geräts (GPU). Nur für GpuUtilization verfügbar. |
NodeId | ID des erstellten Knotens, auf dem der Auftrag ausgeführt wird. Diese Dimension ist nur für CpuUtilization und GpuUtilization verfügbar. |
RunId | ID des Laufs/Auftrags. Diese Dimension ist nur für CpuUtilization und GpuUtilization verfügbar. |
ComputeType | Der für die Ausführung verwendete Computetyp Diese Dimension ist nur für die Metriken „Abgeschlossene Ausführungen“, „Failed Runs“ (Ausführungen mit Fehler) und „Started Runs“ (Begonnene Ausführungen) verfügbar. |
PipelineStepType | Der Typ des PipelineStep-Objekts, das in der Ausführung verwendet wurde Diese Dimension ist nur für die Metriken „Abgeschlossene Ausführungen“, „Failed Runs“ (Ausführungen mit Fehler) und „Started Runs“ (Begonnene Ausführungen) verfügbar. |
PublishedPipelineId | Die ID der veröffentlichten Pipeline, die in der Ausführung verwendet wurde Diese Dimension ist nur für die Metriken „Abgeschlossene Ausführungen“, „Failed Runs“ (Ausführungen mit Fehler) und „Started Runs“ (Begonnene Ausführungen) verfügbar. |
RunType | Der Typ der Ausführung. Diese Dimension ist nur für die Metriken „Abgeschlossene Ausführungen“, „Failed Runs“ (Ausführungen mit Fehler) und „Started Runs“ (Begonnene Ausführungen) verfügbar. |
Gültige Werte für die RunType-Dimension sind:
Wert | Beschreibung |
---|---|
Experiment | Nicht-Pipelineausführungen |
PipelineRun | Eine Pipelineausführung, die das übergeordnete Element einer Schrittausführung (StepRun) ist |
StepRun | Eine Ausführung für einen Pipelineschritt |
ReusedStepRun | Eine Ausführung für einen Pipelineschritt, in dem eine vorherige Ausführung erneut verwendet wird |
Ressourcenprotokolle
In diesem Abschnitt werden die Ressourcenprotokolltypen aufgeführt, die für diesen Service erfasst werden können. Der Abschnitt wird aus der Liste aller in Azure Monitor unterstützten Kategorietypen für Ressourcenprotokolle gezogen.
Unterstützte Ressourcenprotokolle für Microsoft.MachineLearningServices/Registries
Kategorie | Anzeigename der Kategorie | Protokolltabelle | Unterstützt grundlegenden Protokollplan | Unterstützt die Erfassungszeittransformation | Beispielabfragen | Exportkosten |
---|---|---|---|---|---|---|
RegistryAssetReadEvent |
Leseereignis des Registrierungsobjekts | No | Nein | Ja | ||
RegistryAssetWriteEvent |
Schreibereignis des Registrierungsobjekts | AmlRegistryWriteEventsLog Azure ML Registry Write-Ereignisprotokoll. Es speichert Aufzeichnungen von Schreibvorgängen mit Registrierungsdatenzugriff (Datenebene), einschließlich Benutzeridentität, Objektname und Version für jedes Zugriffsereignis. |
No | No | Abfragen | Ja |
Unterstützte Ressourcenprotokolle für Microsoft.MachineLearningServices/Arbeitsbereiche
Kategorie | Anzeigename der Kategorie | Protokolltabelle | Unterstützt grundlegenden Protokollplan | Unterstützt die Erfassungszeittransformation | Beispielabfragen | Exportkosten |
---|---|---|---|---|---|---|
AmlComputeClusterEvent |
AmlComputeClusterEvent | AmlComputeClusterEvent AmlCompute Cluster-Ereignisse |
Nein | Ja | Abfragen | No |
AmlComputeClusterNodeEvent |
AmlComputeClusterNodeEvent | No | Nein | Ja | ||
AmlComputeCpuGpuUtilization |
AmlComputeCpuGpuUtilization | AmlComputeCpuGpuUtilization Azure Machine Learning-Dienste CPU- und GPU-Nutzungsprotokolle. |
Nein | Ja | Abfragen | No |
AmlComputeJobEvent |
AmlComputeJobEvent | AmlComputeJobEvent AmlCompute Job-Ereignisse |
Nein | Ja | Abfragen | No |
AmlRunStatusChangedEvent |
AmlRunStatusChangedEvent | AmlRunStatusChangedEvent Azure Machine Learning-Dienste führen Statusereignisprotokolle aus. |
Nein | Ja | Nein | |
ComputeInstanceEvent |
ComputeInstanceEvent | AmlComputeInstanceEvent Ereignisse beim Zugriff auf die ML Compute-Instanz (Lese-/Schreibzugriff) |
Nein | Ja | Ja | |
DataLabelChangeEvent |
DataLabelChangeEvent | AmlDataLabelEvent Ereignisse beim Zugriff auf Datenbezeichnungen oder deren Projekte (gelesen, erstellt oder gelöscht) |
Nein | Ja | Ja | |
DataLabelReadEvent |
DataLabelReadEvent | AmlDataLabelEvent Ereignisse beim Zugriff auf Datenbezeichnungen oder deren Projekte (gelesen, erstellt oder gelöscht) |
Nein | Ja | Ja | |
DataSetChangeEvent |
DataSetChangeEvent | AmlDataSetEvent Ereignisse, wenn auf einen registrierten oder nicht registrierten ML-Datenspeicher zugegriffen wird (gelesen, erstellt oder gelöscht). |
Nein | Ja | Abfragen | Ja |
DataSetReadEvent |
DataSetReadEvent | AmlDataSetEvent Ereignisse, wenn auf einen registrierten oder nicht registrierten ML-Datenspeicher zugegriffen wird (gelesen, erstellt oder gelöscht). |
Nein | Ja | Abfragen | Ja |
DataStoreChangeEvent |
DataStoreChangeEvent | AmlDataStoreEvent Ereignisse beim Zugriff auf ML-Datenspeicher (gelesen, erstellt oder gelöscht) |
Nein | Ja | Ja | |
DataStoreReadEvent |
DataStoreReadEvent | AmlDataStoreEvent Ereignisse beim Zugriff auf ML-Datenspeicher (gelesen, erstellt oder gelöscht) |
Nein | Ja | Ja | |
DeploymentEventACI |
DeploymentEventACI | AmlDeploymentEvent Ereignisse bei der Modellimplementierung in ACI oder AKS |
Nein | Ja | Ja | |
DeploymentEventAKS |
DeploymentEventAKS | AmlDeploymentEvent Ereignisse bei der Modellimplementierung in ACI oder AKS |
Nein | Ja | Ja | |
DeploymentReadEvent |
DeploymentReadEvent | AmlDeploymentEvent Ereignisse bei der Modellimplementierung in ACI oder AKS |
Nein | Ja | Ja | |
EnvironmentChangeEvent |
EnvironmentChangeEvent | AmlEnvironmentEvent Ereignisse, wenn auf ML-Umgebungen zugegriffen wird (gelesen, erstellt oder gelöscht). |
Nein | Ja | Abfragen | Ja |
EnvironmentReadEvent |
EnvironmentReadEvent | AmlEnvironmentEvent Ereignisse, wenn auf ML-Umgebungen zugegriffen wird (gelesen, erstellt oder gelöscht). |
Nein | Ja | Abfragen | Ja |
InferencingOperationACI |
InferencingOperationACI | AmlInferencingEvent Ereignisse für Rückschlüsse oder verwandte Vorgänge für AKS- oder ACI-Computetypen |
Nein | Ja | Ja | |
InferencingOperationAKS |
InferencingOperationAKS | AmlInferencingEvent Ereignisse für Rückschlüsse oder verwandte Vorgänge für AKS- oder ACI-Computetypen |
Nein | Ja | Ja | |
ModelsActionEvent |
ModelsActionEvent | AmlModelsEvent Ereignisse beim Zugriff auf das ML-Modell (gelesen, erstellt oder gelöscht) Incudes-Ereignisse, wenn das Packen von Modellen und Ressourcen in ein ready-to-Build-Paket erfolgt. |
Nein | Ja | Abfragen | Ja |
ModelsChangeEvent |
ModelsChangeEvent | AmlModelsEvent Ereignisse beim Zugriff auf das ML-Modell (gelesen, erstellt oder gelöscht) Incudes-Ereignisse, wenn das Packen von Modellen und Ressourcen in ein ready-to-Build-Paket erfolgt. |
Nein | Ja | Abfragen | Ja |
ModelsReadEvent |
ModelsReadEvent | AmlModelsEvent Ereignisse beim Zugriff auf das ML-Modell (gelesen, erstellt oder gelöscht) Incudes-Ereignisse, wenn das Packen von Modellen und Ressourcen in ein ready-to-Build-Paket erfolgt. |
Nein | Ja | Abfragen | Ja |
PipelineChangeEvent |
PipelineChangeEvent | AmlPipelineEvent Ereignisse, wenn auf den ML-Pipelineentwurf oder endpunkt oder das Modul zugegriffen wird (gelesen, erstellt oder gelöscht). |
Nein | Ja | Ja | |
PipelineReadEvent |
PipelineReadEvent | AmlPipelineEvent Ereignisse, wenn auf den ML-Pipelineentwurf oder endpunkt oder das Modul zugegriffen wird (gelesen, erstellt oder gelöscht). |
Nein | Ja | Ja | |
RunEvent |
RunEvent | AmlRunEvent Ereignisse beim Zugriff auf ML-Experimente (gelesen, erstellt oder gelöscht) |
Nein | Ja | Ja | |
RunReadEvent |
RunReadEvent | AmlRunEvent Ereignisse beim Zugriff auf ML-Experimente (gelesen, erstellt oder gelöscht) |
Nein | Ja | Ja |
Unterstützte Ressourcenprotokolle für Microsoft.MachineLearningServices/workspaces/onlineEndpoints
Kategorie | Anzeigename der Kategorie | Protokolltabelle | Unterstützt grundlegenden Protokollplan | Unterstützt die Erfassungszeittransformation | Beispielabfragen | Exportkosten |
---|---|---|---|---|---|---|
AmlOnlineEndpointConsoleLog |
AmlOnlineEndpointConsoleLog | AmlOnlineEndpointConsoleLog Konsolenprotokolle der Azure ML-Onlineendpunkte. Sie stellt die Ausgabe von Konsolenprotokollen aus Benutzercontainern bereit. |
Nein | Ja | Abfragen | Ja |
AmlOnlineEndpointEventLog |
AmlOnlineEndpointEventLog | AmlOnlineEndpointEventLog Azure ML-Onlineendpunkte-Ereignisprotokolle. Es stellt Ereignisprotokolle zum Lebenszyklus des Inference-Server-Containers bereit. |
No | No | Abfragen | Ja |
AmlOnlineEndpointTrafficLog |
AmlOnlineEndpointTrafficLog | AmlOnlineEndpointTrafficLog Datenverkehrsprotokolle für AzureML -Onlineendpunkte (Machine Learning). Die Tabelle kann verwendet werden, um die detaillierten Informationen der Anforderung an einen Onlineendpunkt zu überprüfen. Sie können sie beispielsweise verwenden, um die Anforderungsdauer, den Grund für den Anforderungsfehler usw. zu überprüfen. |
No | No | Abfragen | Ja |
Tabellen in Azure Monitor-Protokollen
Dieser Abschnitt bezieht sich die für diesen Service relevanten Azure-Monitor-Protokolltabellen, die für die Abfrage durch Protokollanalyse mit Kusto-Abfragen zur Verfügung stehen. Diese Tabellen enthalten Ressourcenprotokolldaten und möglicherweise mehr, je nachdem, was erfasst und an sie weitergeleitet wird.
Machine Learning
Microsoft.MachineLearningServices/workspaces
- AzureActivity
- AMLOnlineEndpointConsoleLog
- AMLOnlineEndpointTrafficLog
- AMLOnlineEndpointEventLog
- AzureMetrics
- AMLComputeClusterEvent
- AMLComputeClusterNodeEvent
- AMLComputeJobEvent
- AMLRunStatusChangedEvent
- AMLComputeCpuGpuUtilization
- AMLComputeInstanceEvent
- AMLDataLabelEvent
- AMLDataSetEvent
- AMLDataStoreEvent
- AMLDeploymentEvent
- AMLEnvironmentEvent
- AMLInferencingEvent
- AMLModelsEvent
- AMLPipelineEvent
- AMLRunEvent
Microsoft.MachineLearningServices/registries
Aktivitätsprotokoll
In der verknüpften Tabelle sind die Vorgänge aufgeführt, die im Aktivitätsprotokoll für diesen Dienst aufgezeichnet werden können. Diese Operationen sind eine Teilmenge aller möglichen Ressourcenanbietervorgänge im Aktivitätsprotokoll.
Weitere Informationen zum Schema von Aktivitätsprotokolleinträgen finden Sie unter Ereignisschema des Azure-Aktivitätsprotokolls.
In der folgenden Tabelle sind einige Vorgänge im Zusammenhang mit Machine Learning aufgeführt, die im Aktivitätsprotokoll erstellt werden können. Eine vollständige Auflistung der Microsoft.MachineLearningServices-Vorgänge finden Sie unter Microsoft.MachineLearningServices-Ressourcenanbietervorgänge.
Vorgang | BESCHREIBUNG |
---|---|
Creates or updates a Machine Learning workspace (Machine Learning-Arbeitsbereich erstellen oder aktualisieren) | Ein Arbeitsbereich wurde erstellt oder aktualisiert. |
CheckComputeNameAvailability | Hiermit wird überprüft, ob ein Computename bereits verwendet wird. |
Creates or updates the compute resources (Computeressourcen erstellen oder aktualisieren) | Eine Computeressource wurde erstellt oder aktualisiert. |
Deletes the compute resources (Computeressourcen löschen) | Eine Computeressource wurde gelöscht. |
Auflisten geheimer Schlüssel | Hiermit werden Geheimnisse für einen Vorgang für einen Machine Learning-Arbeitsbereich aufgelistet. |
Protokollschemas
Azure Machine Learning verwendet die folgenden Schemas.
Tabelle AmlComputeJobEvent
Eigenschaft | BESCHREIBUNG |
---|---|
TimeGenerated | Zeitpunkt, zu dem der Protokolleintrag generiert wurde |
Vorgangsname | Name des Vorgangs, der dem Protokollereignis zugeordnet ist |
Kategorie | Name des Protokollereignisses |
JobId | ID des übermittelten Auftrags |
ExperimentId | ID des Experiments |
ExperimentName | Name des Experiments |
CustomerSubscriptionId | Abonnement-ID, unter der das Experiment und der Auftrag übermittelt wurden |
WorkspaceName | Name des Machine Learning-Arbeitsbereichs |
ClusterName | Name des Clusters |
ProvisioningState | Status der Auftragsübermittlung |
ResourceGroupName | Name der Ressourcengruppe |
JobName | Name des Auftrags |
ClusterId | ID des Clusters |
EventType | Hierbei handelt es sich um den Typ des Auftragsereignisses. Beispiele: JobSubmitted, JobRunning, JobFailed oder JobSucceeded. |
ExecutionState | Hierbei handelt es sich um den Status des Auftrags (der Ausführung). Beispiele: Queued, Running, Succeeded oder Failed. |
ErrorDetails | Details zum Auftragsfehler |
CreationApiVersion | API-Version, mit der der Auftrag erstellt wurde |
ClusterResourceGroupName | Ressourcengruppenname des Clusters |
TFWorkerCount | Anzahl der TF-Worker |
TFParameterServerCount | Anzahl der TF-Parameterserver |
ToolType | Typ des verwendeten Tools |
RunInContainer | Flag, das beschreibt, ob der Auftrag in einem Container ausgeführt werden soll |
JobErrorMessage | Ausführliche Meldung für den Auftragsfehler |
NodeId | ID des erstellten Knotens, auf dem der Auftrag ausgeführt wird |
Tabelle AmlComputeClusterEvent
Eigenschaft | BESCHREIBUNG |
---|---|
TimeGenerated | Zeitpunkt, zu dem der Protokolleintrag generiert wurde |
Vorgangsname | Name des Vorgangs, der dem Protokollereignis zugeordnet ist |
Kategorie | Name des Protokollereignisses |
ProvisioningState | Bereitstellungsstatus des Clusters |
ClusterName | Name des Clusters |
ClusterType | Typ des Clusters |
CreatedBy | Benutzer, der den Cluster erstellt hat |
CoreCount | Anzahl der Kerne im Cluster |
VmSize | VM-Größe des Clusters |
VmPriority | Priorität der Knoten, die in einem Cluster erstellt wurden (Dedicated/LowPriority) |
ScalingType | Typ der Clusterskalierung (manual/auto) |
InitialNodeCount | Anfängliche Knotenanzahl des Clusters |
MinimumNodeCount | Kleinste Knotenanzahl des Clusters |
MaximumNodeCount | Größte Knotenanzahl des Clusters |
NodeDeallocationOption | Art und Weise, wie die Zuordnung des Knotens aufgehoben werden soll |
Herausgeber | Herausgeber des Clustertyps |
Angebot | Angebot, mit dem der Cluster erstellt wird |
Sku | SKU des im Cluster erstellten Knotens/virtuellen Computers |
Version | Version des Images, das beim Erstellen des Knotens/virtuellen Computers verwendet wird |
SubnetId | Subnetz-ID des Clusters |
AllocationState | Zuweisungsstatus des Clusters |
CurrentNodeCount | Aktuelle Knotenanzahl des Clusters |
TargetNodeCount | Zielknotenanzahl des Clusters beim zentralen Hoch-/Herunterskalieren |
EventType | Typ des Ereignisses während der Clustererstellung |
NodeIdleTimeSecondsBeforeScaleDown | Leerlaufzeit in Sekunden vor horizontalem Herunterskalieren des Clusters |
PreemptedNodeCount | Anzahl der vorzeitig entfernten Knoten des Clusters |
IsResizeGrow | Flag, das angibt, dass der Cluster zentral hochskaliert wird |
VmFamilyName | Name der VM-Familie der Knoten, die im Cluster erstellt werden können |
LeavingNodeCount | Anzahl der verbliebenen Knoten des Clusters |
UnusableNodeCount | Anzahl der nicht verwendbaren Knoten des Clusters |
IdleNodeCount | Anzahl der nicht verwendbaren Knoten des Clusters |
RunningNodeCount | Anzahl der ausführenden Knoten des Clusters |
PreparingNodeCount | Anzahl der vorzubereitenden Knoten des Clusters |
QuotaAllocated | Zugeordnetes Kontingent für den Cluster |
QuotaUtilized | Genutztes Kontingent für den Cluster |
AllocationStateTransitionTime | Übergangszeit von einem Zustand in einen anderen |
ClusterErrorCodes | Fehlercode, der während der Clustererstellung oder Skalierung empfangen wurde |
CreationApiVersion | API-Version, die beim Erstellen des Clusters verwendet wurde |
Tabelle AmlComputeInstanceEvent
Eigenschaft | Beschreibung des Dataflows |
---|---|
type | Name des Protokollereignisses, AmlComputeInstanceEvent |
TimeGenerated | Zeitpunkt (UTC), zu dem der Protokolleintrag generiert wurde |
Ebene | Der Schweregrad des Ereignisses. Er kann „Informational“ (Information), „Warning“ (Warnung), „Error“ (Fehler) oder „Critical“ (Kritisch) lauten. |
ResultType | Der Status des Ereignisses. Häufige Werte sind „Started“, „In Progress“, „Succeeded“, „Failed“, „Active“ und „Resolved“ (Gestartet, In Bearbeitung, Erfolgreich, Fehler, Aktiv, Gelöst). |
CorrelationId | Eine GUID, die ggf. zum Gruppieren eines Satzes mit verwandten Ereignissen verwendet wird. |
Vorgangsname | Der Name des Vorgangs, der dem Protokollereignis zugeordnet ist |
Identity | Identität des Benutzers oder der Anwendung, der bzw. die den Vorgang durchgeführt hat |
AadTenantId | Die Microsoft Entra-Mandanten-ID, für die der Vorgang übermittelt wurde |
AmlComputeInstanceName | Der Name der Compute-Instanz, die dem Protokolleintrag zugeordnet ist |
Tabelle AmlDataLabelEvent
Eigenschaft | Beschreibung des Dataflows |
---|---|
type | Name des Protokollereignisses, AmlDataLabelEvent |
TimeGenerated | Zeitpunkt (UTC), zu dem der Protokolleintrag generiert wurde |
Ebene | Der Schweregrad des Ereignisses. Er kann „Informational“ (Information), „Warning“ (Warnung), „Error“ (Fehler) oder „Critical“ (Kritisch) lauten. |
ResultType | Der Status des Ereignisses. Häufige Werte sind „Started“, „In Progress“, „Succeeded“, „Failed“, „Active“ und „Resolved“ (Gestartet, In Bearbeitung, Erfolgreich, Fehler, Aktiv, Gelöst). |
CorrelationId | Eine GUID, die ggf. zum Gruppieren eines Satzes mit verwandten Ereignissen verwendet wird. |
Vorgangsname | Der Name des Vorgangs, der dem Protokollereignis zugeordnet ist |
Identity | Identität des Benutzers oder der Anwendung, der bzw. die den Vorgang durchgeführt hat |
AadTenantId | Die Microsoft Entra-Mandanten-ID, für die der Vorgang übermittelt wurde |
AmlProjectId | Der eindeutige Bezeichner des Azure Machine Learning-Projekts. |
AmlProjectName | Der Name des Azure Machine Learning-Projekts. |
AmlLabelNames | Die Bezeichnungsklassennamen, die für das Projekt erstellt werden |
AmlDataStoreName | Der Name des Datenspeichers, in dem die Projektdaten gespeichert werden |
Tabelle AmlDataSetEvent
Eigenschaft | Beschreibung des Dataflows |
---|---|
type | Der Name des Protokollereignisses, AmlDataSetEvent |
TimeGenerated | Zeitpunkt (UTC), zu dem der Protokolleintrag generiert wurde |
Ebene | Der Schweregrad des Ereignisses. Er kann „Informational“ (Information), „Warning“ (Warnung), „Error“ (Fehler) oder „Critical“ (Kritisch) lauten. |
ResultType | Der Status des Ereignisses. Häufige Werte sind „Started“, „In Progress“, „Succeeded“, „Failed“, „Active“ und „Resolved“ (Gestartet, In Bearbeitung, Erfolgreich, Fehler, Aktiv, Gelöst). |
AmlWorkspaceId | Eine GUID und eine eindeutige ID des Azure Machine Learning-Arbeitsbereichs. |
Vorgangsname | Der Name des Vorgangs, der dem Protokollereignis zugeordnet ist |
Identity | Identität des Benutzers oder der Anwendung, der bzw. die den Vorgang durchgeführt hat |
AadTenantId | Die Microsoft Entra-Mandanten-ID, für die der Vorgang übermittelt wurde |
AmlDatasetId | Die ID des Azure Machine Learning-Datasets. |
AmlDatasetName | Der Name des Azure Machine Learning-Datasets. |
Tabelle AmlDataStoreEvent
Eigenschaft | Beschreibung des Dataflows |
---|---|
type | Name des Protokollereignisses, AmlDataStoreEvent |
TimeGenerated | Zeitpunkt (UTC), zu dem der Protokolleintrag generiert wurde |
Ebene | Der Schweregrad des Ereignisses. Er kann „Informational“ (Information), „Warning“ (Warnung), „Error“ (Fehler) oder „Critical“ (Kritisch) lauten. |
ResultType | Der Status des Ereignisses. Häufige Werte sind „Started“, „In Progress“, „Succeeded“, „Failed“, „Active“ und „Resolved“ (Gestartet, In Bearbeitung, Erfolgreich, Fehler, Aktiv, Gelöst). |
AmlWorkspaceId | Eine GUID und eine eindeutige ID des Azure Machine Learning-Arbeitsbereichs. |
Vorgangsname | Der Name des Vorgangs, der dem Protokollereignis zugeordnet ist |
Identity | Identität des Benutzers oder der Anwendung, der bzw. die den Vorgang durchgeführt hat |
AadTenantId | Die Microsoft Entra-Mandanten-ID, für die der Vorgang übermittelt wurde |
AmlDatastoreName | Der Name des Azure Machine Learning-Datenspeichers. |
Tabelle AmlDeploymentEvent
Eigenschaft | Beschreibung des Dataflows |
---|---|
type | Der Name des Protokollereignisses, AmlDeploymentEvent |
TimeGenerated | Zeitpunkt (UTC), zu dem der Protokolleintrag generiert wurde |
Ebene | Der Schweregrad des Ereignisses. Er kann „Informational“ (Information), „Warning“ (Warnung), „Error“ (Fehler) oder „Critical“ (Kritisch) lauten. |
ResultType | Der Status des Ereignisses. Häufige Werte sind „Started“, „In Progress“, „Succeeded“, „Failed“, „Active“ und „Resolved“ (Gestartet, In Bearbeitung, Erfolgreich, Fehler, Aktiv, Gelöst). |
Vorgangsname | Der Name des Vorgangs, der dem Protokollereignis zugeordnet ist |
Identity | Identität des Benutzers oder der Anwendung, der bzw. die den Vorgang durchgeführt hat |
AadTenantId | Die Microsoft Entra-Mandanten-ID, für die der Vorgang übermittelt wurde |
AmlServiceName | Der Name des Azure Machine Learning-Diensts. |
Tabelle AmlInferencingEvent
Eigenschaft | Beschreibung des Dataflows |
---|---|
type | Der Name des Protokollereignisses, AmlInferencingEvent |
TimeGenerated | Zeitpunkt (UTC), zu dem der Protokolleintrag generiert wurde |
Ebene | Der Schweregrad des Ereignisses. Er kann „Informational“ (Information), „Warning“ (Warnung), „Error“ (Fehler) oder „Critical“ (Kritisch) lauten. |
ResultType | Der Status des Ereignisses. Häufige Werte sind „Started“, „In Progress“, „Succeeded“, „Failed“, „Active“ und „Resolved“ (Gestartet, In Bearbeitung, Erfolgreich, Fehler, Aktiv, Gelöst). |
Vorgangsname | Der Name des Vorgangs, der dem Protokollereignis zugeordnet ist |
Identity | Identität des Benutzers oder der Anwendung, der bzw. die den Vorgang durchgeführt hat |
AadTenantId | Die Microsoft Entra-Mandanten-ID, für die der Vorgang übermittelt wurde |
AmlServiceName | Der Name des Azure Machine Learning-Diensts. |
Tabelle AmlModelsEvent
Eigenschaft | Beschreibung des Dataflows |
---|---|
type | Der Name des Protokollereignisses, AmlModelsEvent |
TimeGenerated | Zeitpunkt (UTC), zu dem der Protokolleintrag generiert wurde |
Ebene | Der Schweregrad des Ereignisses. Er kann „Informational“ (Information), „Warning“ (Warnung), „Error“ (Fehler) oder „Critical“ (Kritisch) lauten. |
ResultType | Der Status des Ereignisses. Häufige Werte sind „Started“, „In Progress“, „Succeeded“, „Failed“, „Active“ und „Resolved“ (Gestartet, In Bearbeitung, Erfolgreich, Fehler, Aktiv, Gelöst). |
Vorgangsname | Der Name des Vorgangs, der dem Protokollereignis zugeordnet ist |
Identity | Identität des Benutzers oder der Anwendung, der bzw. die den Vorgang durchgeführt hat |
AadTenantId | Die Microsoft Entra-Mandanten-ID, für die der Vorgang übermittelt wurde |
ResultSignature | Der HTTP-Statuscode des Ereignisses. Typische Werte sind 200, 201, 202 usw. |
AmlModelName | Der Name des Azure Machine Learning-Modells. |
Tabelle AmlPipelineEvent
Eigenschaft | Beschreibung des Dataflows |
---|---|
type | Der Name des Protokollereignisses, AmlPipelineEvent |
TimeGenerated | Zeitpunkt (UTC), zu dem der Protokolleintrag generiert wurde |
Ebene | Der Schweregrad des Ereignisses. Er kann „Informational“ (Information), „Warning“ (Warnung), „Error“ (Fehler) oder „Critical“ (Kritisch) lauten. |
ResultType | Der Status des Ereignisses. Häufige Werte sind „Started“, „In Progress“, „Succeeded“, „Failed“, „Active“ und „Resolved“ (Gestartet, In Bearbeitung, Erfolgreich, Fehler, Aktiv, Gelöst). |
AmlWorkspaceId | Eine GUID und eine eindeutige ID des Azure Machine Learning-Arbeitsbereichs. |
AmlWorkspaceId | Der Name des Azure Machine Learning-Arbeitsbereichs. |
Vorgangsname | Der Name des Vorgangs, der dem Protokollereignis zugeordnet ist |
Identity | Identität des Benutzers oder der Anwendung, der bzw. die den Vorgang durchgeführt hat |
AadTenantId | Die Microsoft Entra-Mandanten-ID, für die der Vorgang übermittelt wurde |
AmlModuleId | Eine GUID und eine eindeutige ID des Moduls |
AmlModelName | Der Name des Azure Machine Learning-Modells. |
AmlPipelineId | Die ID der Azure Machine Learning-Pipeline. |
AmlParentPipelineId | Die ID der übergeordneten Azure Machine Learning-Pipeline (beim Klonen). |
AmlPipelineDraftId | Die ID des Azure Machine Learning-Pipelineentwurfs. |
AmlPipelineDraftName | Der Name des Azure Machine Learning-Pipelineentwurfs. |
AmlPipelineEndpointId | Die ID des Azure Machine Learning-Pipelineendpunkts. |
AmlPipelineEndpointName | Der Name des Azure Machine Learning-Pipelineendpunkts. |
Tabelle AmlRunEvent
Eigenschaft | Beschreibung des Dataflows |
---|---|
type | Der Name des Protokollereignisses, AmlRunEvent |
TimeGenerated | Zeitpunkt (UTC), zu dem der Protokolleintrag generiert wurde |
Ebene | Der Schweregrad des Ereignisses. Er kann „Informational“ (Information), „Warning“ (Warnung), „Error“ (Fehler) oder „Critical“ (Kritisch) lauten. |
ResultType | Der Status des Ereignisses. Häufige Werte sind „Started“, „In Progress“, „Succeeded“, „Failed“, „Active“ und „Resolved“ (Gestartet, In Bearbeitung, Erfolgreich, Fehler, Aktiv, Gelöst). |
Vorgangsname | Der Name des Vorgangs, der dem Protokollereignis zugeordnet ist |
AmlWorkspaceId | Eine GUID und eine eindeutige ID des Azure Machine Learning-Arbeitsbereichs. |
Identity | Identität des Benutzers oder der Anwendung, der bzw. die den Vorgang durchgeführt hat |
AadTenantId | Die Microsoft Entra-Mandanten-ID, für die der Vorgang übermittelt wurde |
RunId | Die eindeutige ID des Durchlaufs. |
Tabelle „AmlEnvironmentEvent“
Eigenschaft | Beschreibung des Dataflows |
---|---|
type | Der Name des Protokollereignisses, AmlEnvironmentEvent |
TimeGenerated | Zeitpunkt (UTC), zu dem der Protokolleintrag generiert wurde |
Ebene | Der Schweregrad des Ereignisses. Er kann „Informational“ (Information), „Warning“ (Warnung), „Error“ (Fehler) oder „Critical“ (Kritisch) lauten. |
Vorgangsname | Der Name des Vorgangs, der dem Protokollereignis zugeordnet ist |
Identity | Identität des Benutzers oder der Anwendung, der bzw. die den Vorgang durchgeführt hat |
AadTenantId | Die Microsoft Entra-Mandanten-ID, für die der Vorgang übermittelt wurde |
AmlEnvironmentName | Der Name der Azure Machine Learning-Umgebungskonfiguration. |
AmlEnvironmentVersion | Der Name der Azure Machine Learning-Umgebungskonfigurationsversion. |
Tabelle „AMLOnlineEndpointTrafficLog“ (Vorschau)
Eigenschaft | BESCHREIBUNG |
---|---|
Methode | Die vom Client angeforderte Methode. |
`Path` | Der vom Client angeforderte Pfad. |
SubscriptionId | Die Machine Learning-Abonnement-ID des Onlineendpunkts. |
AzureMLWorkspaceId | Die Machine Learning-Arbeitsbereichs-ID des Onlineendpunkts. |
AzureMLWorkspaceName | Der Name des Machine Learning-Arbeitsbereichs des Online-Endpunkts. |
EndpointName | Der Name des Onlineendpunkts. |
DeploymentName | Der Name der Onlinebereitstellung. |
Protocol | Das Protokoll der Anforderung. |
ResponseCode | Der endgültige Antwortcode, der an den Client zurückgegeben wird. |
ResponseCodeReason | Der endgültige Grund für den Antwortcode, der an den Client zurückgegeben wird. |
ModelStatusCode | Der Antwortstatuscode vom Modell. |
ModelStatusReason | Der Antwortstatusgrund vom Modell. |
RequestPayloadSize | Die insgesamt vom Client empfangenen Bytes. |
ResponsePayloadSize | Die insgesamt an den Client zurückgesendeten Bytes. |
UserAgent | Der Benutzer-Agent-Header der Anforderung, einschließlich Kommentaren, aber auf maximal 70 Zeichen abgeschnitten. |
XRequestId | Die von Azure Machine Learning für die interne Ablaufverfolgung generierte ID der Anforderung. |
XMSClientRequestId | Die vom Client generierte Nachverfolgungs-ID. |
TotalDurationMs | Dauer in Millisekunden vom Startzeitpunkt der Anforderung bis zum letzten Antwortbyte, das an den Client zurückgesendet wurde. Wenn der Client die Verbindung unterbrochen hat, wird die Zeit von der Startzeit bis zur Unterbrechung der Verbindung durch den Client gemessen. |
RequestDurationMs | Dauer in Millisekunden vom Startzeitpunkt der Anforderung bis zum letzten Byte der vom Client empfangenen Anforderung. |
ResponseDurationMs | Dauer in Millisekunden vom Startzeitpunkt der Anforderung bis zum ersten vom Modell gelesenen Antwortbyte. |
RequestThrottlingDelayMs | Verzögerung in Millisekunden bei der Übertragung von Anforderungen aufgrund der Netzwerk-Bandbreiteneinschränkung. |
ResponseThrottlingDelayMs | Verzögerung in Millisekunden bei der Antwortdatenübertragung aufgrund der Netzwerk-Bandbreiteneinschränkung. |
Weitere Informationen zu diesem Protokoll finden Sie unter Überwachen von Onlineendpunkten.
AMLOnlineEndpointConsoleLog
Eigenschaft | BESCHREIBUNG |
---|---|
TimeGenerated | Der Zeitstempel (UTC), wann das Protokoll generiert wurde. |
Vorgangsname | Der mit der Protokollaufzeichnung verbundene Vorgang. |
InstanceId | Die ID der Instanz, die diesen Protokolldatensatz generiert hat. |
DeploymentName | Der Name der Bereitstellung, die dem Protokolldatensatz zugeordnet ist. |
ContainerName | Der Name des Containers, in dem das Protokoll generiert wurde. |
`Message` | Der Inhalt des Protokolls. |
Weitere Informationen zu diesem Protokoll finden Sie unter Überwachen von Onlineendpunkten.
AMLOnlineEndpointEventLog (Vorschau)
Eigenschaft | BESCHREIBUNG |
---|---|
TimeGenerated | Der Zeitstempel (UTC), wann das Protokoll generiert wurde. |
Vorgangsname | Der mit der Protokollaufzeichnung verbundene Vorgang. |
InstanceId | Die ID der Instanz, die diesen Protokolldatensatz generiert hat. |
DeploymentName | Der Name der Bereitstellung, die dem Protokolldatensatz zugeordnet ist. |
Name | Der Name des Ereignisses. |
`Message` | Der Inhalt des Protokolls. |
Weitere Informationen zu diesem Protokoll finden Sie unter Überwachen von Onlineendpunkten.
Zugehöriger Inhalt
- Eine Beschreibung der Überwachung von Machine Learning finden Sie unter Monitor Machine Learning .
- Weitere Informationen zur Überwachung von Azure-Ressourcen finden Sie unter Überwachen von Azure-Ressourcen mit Azure Monitor.