Freigeben über


Datensammlung von Modellen in der Produktion

GILT FÜR:Azure CLI ML-Erweiterung v2 (aktuell)Python SDK azure-ai-ml v2 (aktuell)

In diesem Artikel finden Sie Informationen zur Datensammlung aus Modellen, die auf Azure Machine Learning-Onlineendpunkten bereitgestellt werden.

Der Datensammler von Azure Machine Learning ermöglicht die Echtzeitprotokollierung von Ein- und Ausgabedaten aus Modellen, die für verwaltete Onlineendpunkte oder für Kubernetes-Onlineendpunkte bereitgestellt werden. Azure Machine Learning speichert die protokollierten Rückschlussdaten in Azure Blob Storage. Diese Daten können dann nahtlos für die Modellüberwachung, zum Debuggen oder für die Überwachung verwendet werden, um die Leistung Ihrer bereitgestellten Modelle zu überwachen.

Der Datensammler bietet Folgendes:

  • Protokollierung von Rückschlussdaten an einem zentralen Ort (Azure Blob Storage)
  • Unterstützung von verwalteten Onlineendpunkten und Kubernetes-Onlineendpunkten
  • Definition auf Bereitstellungsebene, was maximale Konfigurationsänderungen ermöglicht
  • Unterstützung von Nutzdatenprotokollierung und benutzerdefinierter Protokollierung

Protokollierungsmodi

Der Datensammler bietet zwei Protokollierungsmodi: Nutzdatenprotokollierung und benutzerdefinierte Protokollierung. Mit der Nutzdatenprotokollierung können Sie die Nutzdaten von HTTP-Anforderungen und -Antworten aus Ihren bereitgestellten Modellen sammeln. Mit der benutzerdefinierten Protokollierung stellt Azure Machine Learning ein Python SDK bereit, mit dem Sie Pandas-DataFrames direkt über Ihr Bewertungsskript protokollieren können. Mithilfe des Python SDK für die benutzerdefinierte Protokollierung können Sie Ein- und Ausgabedaten des Modells sowie Daten vor, während und nach allen Datentransformationen (oder Vorverarbeitungen) protokollieren.

Datensammlerkonfiguration

Der Datensammler kann auf Bereitstellungsebene konfiguriert werden, und die Konfiguration wird zur Bereitstellungszeit angegeben. Sie können das gewünschte Azure Blob Storage-Ziel für die gesammelten Daten konfigurieren. Außerdem können Sie die Stichprobenrate (zwischen null und 100 Prozent) der zu sammelnden Daten konfigurieren.

Einschränkungen

Für den Datensammler gelten folgende Einschränkungen:

  • Der Datensammler unterstützt nur die Protokollierung für Azure Machine Learning-Onlineendpunkte (oder Echtzeitendpunkte; verwaltet oder Kubernetes).
  • Das Python SDK des Datencollectors unterstützt nur die Protokollierung von Tabellendaten über pandas-DataFrames.