Freigeben über


Grundlegendes zu Entitäten auf oberster Ebene im verwalteten Feature Store

In diesem Dokument werden die Entitäten auf oberster Ebene im verwalteten Feature Store beschrieben.

Diagramm mit den Hauptkomponenten des verwalteten Feature Stores.

Weitere Informationen zum verwalteten Feature Store finden Sie unter Was ist der verwaltete Feature Store?.

Featurespeicher

Sie können Featuresätze mithilfe eines Feature Stores erstellen und verwalten. Ein Featuresatz ist eine Sammlung von Features. Sie können einem Feature Store optional einen Materialisierungsspeicher (Offlinespeicherverbindung) zuordnen, um die Features regelmäßig vorzuberechnen und dauerhaft zu speichern. Durch diese Vorgehensweise kann der Featureabruf während des Trainings oder Rückschlusses schneller und zuverlässiger erfolgen.

Weitere Informationen zur Konfiguration finden Sie unter YAML-Schema für den Feature Store der CLI (v2).

Entitäten

Eine Entität kapselt die Indexspalten für logische Entitäten in einem Unternehmen. Beispiele für Entitäten sind Kontoentität, Kundenentität usw. Entitäten helfen dabei, die Verwendung der gleichen Indexspaltendefinitionen in den Featuresätzen, die die gleichen logischen Entitäten verwenden, als bewährte Methode durchzusetzen.

Entitäten werden in der Regel einmal erstellt und dann in verschiedenen Featuresätzen wiederverwendet. Entitäten werden mit einer Versionsangabe versehen.

Weitere Informationen zur Konfiguration finden Sie unter YAML-Schema für die Featureentität der CLI (v2).

Featuresatzspezifikation und -ressource

Ein Featuresatz ist eine Sammlung von Features, die durch die Anwendung einer Transformation auf Quellsystemdaten erzeugt werden. Featuresätze kapseln eine Quelle, die Transformationsfunktion und die Materialisierungseinstellungen. Wir unterstützen derzeit PySpark Feature Transformation Code.

Erstellen Sie zunächst eine Featuresatzspezifikation. Eine Featuresatzspezifikation ist eine eigenständige Definition eines Featuresatzes, die Sie lokal entwickeln und testen können.

Eine Featuresatzspezifikation besteht in der Regel aus folgenden Parametern:

  • source: die Quellen, denen dieses Feature zugeordnet ist
  • transformation (optional): Die Transformationslogik, die auf die Quelldaten angewendet wird, um Merkmale zu erstellen. In unserem Fall verwenden wir Spark als unterstützte Recheneinheit.
  • Namen der Spalten, die die index_columns und die timestamp_column darstellen: Diese Namen werden benötigt, wenn Benutzer versuchen, Merkmalsdaten mit Beobachtungsdaten zu verknüpfen (mehr dazu später)
  • materialization_settings (optional): erforderlich, wenn Sie die Featurewerte für einen effizienten Abruf in einem Materialisierungsspeicher zwischenspeichern möchten.

Nachdem Sie die Featuresatzspezifikation in Ihrer lokalen Umgebung/Entwicklungsumgebung entwickelt und getestet haben, können Sie sie als Featuresatzressource im Feature Store registrieren. Die Featuresatzressource bietet verwaltete Funktionen, z. B. Versionsverwaltung und Materialisierung.

Weitere Informationen zur YAML-Spezifikation für den Featuresatz finden Sie unter YAML-Schema für die Featuresatzspezifikation der CLI (v2).

Featureabrufspezifikation

Eine Featureabrufspezifikation ist eine portierbare Definition einer mit einem Modell verknüpften Featureliste. Sie kann dazu beitragen, die Entwicklung und Operationalisierung von Modellen für maschinelles Lernen zu rationalisieren. Eine Spezifikation für das Abrufen von Merkmalen ist in der Regel ein Input für die Trainingspipeline. Sie hilft bei der Erstellung der Trainingsdaten. Sie kann zusammen mit dem Modell gepackt werden. Darüber hinaus wird sie im Rückschlussschritt verwendet, um nach den Features zu suchen. Es integriert alle Phasen des Lebenszyklus des maschinellen Lernens. Änderungen an Ihrer Trainings- und Rückschlusspipeline können beim Experimentieren und Bereitstellen minimiert werden.

Die Verwendung einer Spezifikation für die Merkmalsabfrage und der eingebauten Komponente für die Merkmalsabfrage ist optional. Sie können direkt die get_offline_features() API verwenden, wenn Sie möchten.

Weitere Informationen zur YAML-Spezifikation für den Featureabruf finden Sie unter YAML-Schema für die Featureabrufspezifikation der CLI (v2).

Nächste Schritte