Benutzeroberfläche des Arbeitsbereich-Featurespeichers (Legacy)
Hinweis
In dieser Dokumentation wird der Featurespeicher des Arbeitsbereichs behandelt. Verwenden Sie diese Seite, wenn Ihr Arbeitsbereich nicht für Unity Catalog aktiviert ist.
Databricks empfiehlt die Verwendung von Feature Engineering in Unity Catalog. Der Featurespeicher des Arbeitsbereichs wird in Zukunft eingestellt.
Gründe für die Verwendung des Arbeitsbereich-Featurespeichers
Der Arbeitsbereich-Featurespeicher ist vollständig in andere Komponenten von Azure Databricks integriert.
- Erkennbarkeit. Über die Benutzeroberfläche des Featurespeichers, auf die Sie vom Databricks-Arbeitsbereich aus zugreifen können, können Sie nach vorhandenen Features suchen.
- Herkunft. Wenn Sie eine Featuretabelle in Azure Databricks erstellen, werden die zur Erstellung der Featuretabelle verwendeten Datenquellen gespeichert und sind zugänglich. Für jedes Feature in einer Featuretabelle können Sie auch auf die Modelle, Notebooks, Aufträge und Endpunkte zugreifen, die das Feature verwenden.
- Integration mit Modellbewertung und -bereitstellung. Wenn Sie Features aus dem Featurespeicher verwenden, um ein Modell zu trainieren, wird das Modell mit Featuremetadaten verpackt. Wenn Sie das Modell für Batchbewertungen oder Onlinerückschlüsse verwenden, ruft es automatisch Features aus dem Featurespeicher ab. Der Aufrufer muss diese nicht kennen oder eine Logik zum Suchen oder Verbinden von Features einfügen, um neue Daten zu bewerten. Das macht die Modellimplementierung und -aktualisierung viel einfacher.
- Point-in-Time-Lookups. Der Featurespeicher unterstützt Zeitreihen und ereignisbasierte Anwendungsfälle, bei denen Point-in-Time-Genauigkeit erforderlich ist.
Wie funktioniert der Arbeitsbereich-Featurespeicher?
Der typische Machine Learning-Workflow mit Featurespeicher folgt diesem Muster:
- Schreiben Sie Code, um Rohdaten in Features zu konvertieren und einen Spark-DataFrame zu erstellen, der die gewünschten Features enthält.
- Schreiben Sie den DataFrame als Featuretabelle in den Arbeitsbereich-Featurespeicher.
- Trainieren Sie ein Modell mithilfe von Features aus dem Featurespeicher. Wenn Sie dies tun, speichert das Modell die Spezifikationen von Features, die für Trainings verwendet werden. Wenn das Modell für den Rückschluss verwendet wird, werden automatisch Features aus den entsprechenden Featuretabellen verknüpft.
- Registrieren des Modells in der Modellregistrierung.
Anschließend können Sie das Modell dazu nutzen, um Vorhersagen für neue Daten zu treffen. Für Batchanwendungsfälle ruft das Modell automatisch die benötigten Features aus dem Feature Store ab.
Veröffentlichen Sie die Features für echtzeitbasierte Anwendungsfälle in einem Onlinespeicher. Siehe Onlinespeicher von Drittanbietern.
Zum Zeitpunkt des Rückschlusses liest das Modell vorab berechnete Features aus dem Onlinespeicher aus und verknüpft sie mit den Daten, die in der Clientanforderung für den Modellbereitstellungsendpunkt bereitgestellt werden.
Starten Sie die Verwendung des Arbeitsbereich-Featurespeichers
Probieren Sie zunächst diese Beispiel-Notebooks aus. Im grundlegenden Notebook erfahren Sie, wie Sie eine Feature-Tabelle erstellen, sie zum Trainieren eines Modells verwenden und anschließend Batchbewertungen mithilfe des automatischen Feature-Lookups durchführen. Außerdem wird die Feature Engineering-Benutzeroberfläche vorgestellt und gezeigt, wie Sie damit nach Features suchen und verstehen können, wie Features erstellt und verwendet werden.
Beispiel-Notebook für den Standardarbeitsbereich-Feature Store
Das Beispielnotebook „Taxi“ veranschaulicht den Prozess der Erstellung von Features, deren Aktualisierung und deren Verwendung für das Modelltraining und den Batchrückschluss.
Taxibeispiel-Notebook für den Arbeitsbereich-Featurespeicher
Unterstützte Datentypen
Unterstützte Typen finden Sie unter Unterstützte Datentypen.