Freigeben über


Versionshinweise für Databricks-Feature Engineering und den Legacy-Feature Store für Arbeitsbereiche

Auf dieser Seite sind die Releases des Databricks-Client für Feature Engineering im Unity Catalog und des Databricks-Arbeitsbereichsclients im Feature Store aufgeführt. Beide Clients sind auf PyPI als databricks-feature-engineering verfügbar.

Die Bibliotheken werden verwendet für:

  • Erstellen, Lesen und Schreiben von Featuretabellen
  • Trainieren von Modellen für Featuredaten
  • Veröffentlichen von Featuretabellen in Onlinespeichern für Echtzeitbereitstellung

Eine Dokumentation finden Sie unter Databricks-Featurespeicher. Eine Dokumentation zur Python-API finden Sie unter Python-API.

Der Client für Feature Engineering im Unity Catalog funktioniert für Features und Featuretabellen im Unity-Katalog. Der Arbeitsbereichsclient im Feature Store funktioniert für Features und Featuretabellen im Arbeitsbereich-Feature Store. Beide Clients sind in Databricks Runtime für Machine Learning vorinstalliert. Sie können auch nach der Installation databricks-feature-engineering von PyPI (pip install databricks-feature-engineering) in Databricks Runtime ausgeführt werden. Beide Clients können lokal oder in CI/CD-Umgebungen nur für Komponententests verwendet werden.

Eine Tabelle, welche die Kompatibilität von Clientversionen mit Databricks Runtime- und Databricks Runtime ML-Versionen zeigt, finden Sie in der Feature Engineering-Kompatibilitätsmatrix. Ältere Versionen des Databricks-Arbeitsbereichsclient im Feature Store sind auf PyPI als databricks-feature-store verfügbar.

databricks-feature-engineering 0.7.0

  • Bestimmte Ansichten in Unity Catalog können jetzt als Featuretabellen für das Offline-Training und die Offline-Bewertung von Modellen und verwendet werden. Siehe Lesen aus einer Featuretabelle in Unity Catalog.
  • Trainingssätze können jetzt mit Featuresuchen oder einer Featurespezifikation erstellt werden. Weitere Informationen finden Sie in der Python SDK-Referenz.

databricks-feature-engineering 0.6.0

  • Das Ausführen von Point-in-Time-Verknüpfungen mit nativem Spark wird jetzt zusätzlich zum bestehenden Support mit Tempo unterstützt. Vielen Dank an Semyon Sinchenko für diesen Vorschlag!
  • StructType wird jetzt als PySpark-Datentyp unterstützt. StructType wird für die Onlinebereitstellung nicht unterstützt.
  • write_table unterstützt jetzt das Schreiben in Tabellen mit aktiviertem Liquid Clustering.
  • Der timeseries_columns-Parameter für create_table wurde in timeseries_column umbenannt. Vorhandene Workflows können den timeseries_columns-Parameter weiterhin verwenden.
  • score_batch unterstützt jetzt den env_manager-Parameter. Weitere Informationen finden Sie in der MLflow-Dokumentation.

databricks-feature-engineering 0.5.0

  • Neue API update_feature_spec in databricks-feature-engineering, mit der Benutzer den Besitzer eines FeatureSpec im Unity-Katalog aktualisieren können.

databricks-feature-engineering 0.4.0

  • Kleine Fehlerbehebungen und Verbesserungen.

databricks-feature-engineering 0.3.0

  • log_model verwendet jetzt das neue databricks-feature-lookup PyPI-Paket, das Leistungsverbesserungen für die Onlinemodellbereitstellung enthält.

databricks-feature-store 0.17.0

  • databricks-feature-store ist veraltet. Alle vorhandenen Module in diesem Paket sind in databricks-feature-engineering Version 0.2.0 und höher verfügbar. Weitere Informationen finden Sie unter Python-API.

databricks-feature-engineering 0.2.0

  • databricks-feature-engineering enthält jetzt alle Module aus databricks-feature-store. Weitere Informationen finden Sie unter Python-API.

databricks-feature-store 0.16.3

  • Behebt einen Timeoutfehler bei Verwendung von AutoML mit Featuretabellen.

databricks-feature-engineering 0.1.3

  • Kleine Verbesserungen bei UpgradeClient.

databricks-feature-store 0.16.2

  • Sie können jetzt Feature and Function Serving-Endpunkte erstellen. Ausführliche Informationen finden Sie unter Feature and Function Serving.

databricks-feature-store 0.16.1

  • Kleine Fehlerbehebungen und Verbesserungen.

databricks-feature-engineering 0.1.2 & databricks-feature-store 0.16.0

  • Kleine Fehlerbehebungen und Verbesserungen.
    • Falsche Auftragsherkunfts-URLs korrigiert, die bei bestimmten Arbeitsbereichssetups protokolliert wurden.

databricks-feature-engineering 0.1.1

  • Kleine Fehlerbehebungen und Verbesserungen.

databricks-feature-engineering 0.1.0

  • GA-Version von Feature Engineering im Unity Catalog-Python-Client auf PyPI

databricks-feature-store 0.15.1

  • Kleine Fehlerbehebungen und Verbesserungen.

databricks-feature-store 0.15.0

  • Sie können jetzt automatisch Rückschlüsse aus einem Eingabebeispiel ziehen und das Beispiel protokollieren, wenn Sie ein Modell protokollieren. Legen Sie dazu infer_model_example auf True fest, wenn Sie log_model aufrufen. Das Beispiel basiert auf den im Parameter training_set angegebenen Trainingsdaten.

databricks-feature-store 0.14.2

  • Behebung eines Fehlers bei der Veröffentlichung in Aurora MySQL von MariaDB-Connector/J >=2.7.5.

databricks-feature-store 0.14.1

  • Kleine Fehlerbehebungen und Verbesserungen.

databricks-feature-store 0.14.0

Ab 0.14.0 müssen Sie Zeitstempelschlüsselspalten im Argument primary_keys angeben. Zeitstempelschlüssel sind Teil der „Primärschlüssel“, die jede Zeile in der Featuretabelle eindeutig identifizieren. Wie andere Primärschlüsselspalten dürfen Zeitstempelschlüsselspalten keine NULL-Werte enthalten.

Im folgenden Beispiel enthält der Datenrahmen user_features_df die folgenden Spalten: user_id, ts, purchases_30d und is_free_trial_active.

0.14.0 und höher

fs = FeatureStoreClient()

fs.create_table(
name="ads_team.user_features",
primary_keys=["user_id", "ts"],
timestamp_keys="ts",
features_df=user_features_df,
)

0.13.1 und früher

fs = FeatureStoreClient()

fs.create_table(
name="ads_team.user_features",
primary_keys="user_id",
timestamp_keys="ts",
features_df=user_features_df,
)

databricks-feature-store 0.13.1

  • Kleine Fehlerbehebungen und Verbesserungen.

databricks-feature-store 0.13.0

  • Version 2.4.0 ist jetzt die mindestens erforderliche mlflow-skinny-Version.
  • Das Erstellen eines Trainingssatzes schlägt fehl, wenn der bereitgestellte DataFrame nicht alle erforderlichen Nachschlageschlüssel enthält.
  • Beim Protokollieren eines Modells, das Featuretabellen in Unity Catalog verwendet, wird automatisch eine MLflow-Signatur mit dem Modell protokolliert.

databricks-feature-store 0.12.0

  • Sie können jetzt einen Online-Shop mithilfe der drop_online_table-API löschen.

databricks-feature-store 0.11.0

  • In Unity Catalog-fähigen Arbeitsbereichen können Sie jetzt sowohl Arbeitsbereiche als auch Unity Catalog-Featuretabellen in Cosmos DB-Online-Stores veröffentlichen. Dies erfordert Databricks Runtime 13.0 ML oder höher.

databricks-feature-store 0.10.0

  • Kleine Fehlerbehebungen und Verbesserungen.

databricks-feature-store 0.9.0

  • Kleine Fehlerbehebungen und Verbesserungen.

databricks-feature-store 0.8.0

  • Kleine Fehlerbehebungen und Verbesserungen.

databricks-feature-store 0.7.1

  • flask als Abhängigkeit hinzugefügt, um das Problem fehlender Abhängigkeiten beim Bewerten von Modellen mit score_batch zu beheben.

databricks-feature-store 0.7.0

  • Kleine Fehlerbehebungen und Verbesserungen.

databricks-feature-store 0.6.1

  • Erste veröffentlichte Version des Databricks-Featurespeicher-Clients in PyPI.