Versionshinweise für Databricks-Feature Engineering und den Legacy-Feature Store für Arbeitsbereiche
Auf dieser Seite sind die Releases des Databricks-Client für Feature Engineering im Unity Catalog und des Databricks-Arbeitsbereichsclients im Feature Store aufgeführt. Beide Clients sind auf PyPI als databricks-feature-engineering verfügbar.
Die Bibliotheken werden verwendet für:
- Erstellen, Lesen und Schreiben von Featuretabellen
- Trainieren von Modellen für Featuredaten
- Veröffentlichen von Featuretabellen in Onlinespeichern für Echtzeitbereitstellung
Eine Dokumentation finden Sie unter Databricks-Featurespeicher. Eine Dokumentation zur Python-API finden Sie unter Python-API.
Der Client für Feature Engineering im Unity Catalog funktioniert für Features und Featuretabellen im Unity-Katalog. Der Arbeitsbereichsclient im Feature Store funktioniert für Features und Featuretabellen im Arbeitsbereich-Feature Store. Beide Clients sind in Databricks Runtime für Machine Learning vorinstalliert. Sie können auch nach der Installation databricks-feature-engineering
von PyPI (pip install databricks-feature-engineering
) in Databricks Runtime ausgeführt werden. Beide Clients können lokal oder in CI/CD-Umgebungen nur für Komponententests verwendet werden.
Eine Tabelle, welche die Kompatibilität von Clientversionen mit Databricks Runtime- und Databricks Runtime ML-Versionen zeigt, finden Sie in der Feature Engineering-Kompatibilitätsmatrix. Ältere Versionen des Databricks-Arbeitsbereichsclient im Feature Store sind auf PyPI als databricks-feature-store verfügbar.
databricks-feature-engineering 0.7.0
- Bestimmte Ansichten in Unity Catalog können jetzt als Featuretabellen für das Offline-Training und die Offline-Bewertung von Modellen und verwendet werden. Siehe Lesen aus einer Featuretabelle in Unity Catalog.
- Trainingssätze können jetzt mit Featuresuchen oder einer Featurespezifikation erstellt werden. Weitere Informationen finden Sie in der Python SDK-Referenz.
databricks-feature-engineering 0.6.0
- Das Ausführen von Point-in-Time-Verknüpfungen mit nativem Spark wird jetzt zusätzlich zum bestehenden Support mit Tempo unterstützt. Vielen Dank an Semyon Sinchenko für diesen Vorschlag!
StructType
wird jetzt als PySpark-Datentyp unterstützt.StructType
wird für die Onlinebereitstellung nicht unterstützt.write_table
unterstützt jetzt das Schreiben in Tabellen mit aktiviertem Liquid Clustering.- Der
timeseries_columns
-Parameter fürcreate_table
wurde intimeseries_column
umbenannt. Vorhandene Workflows können dentimeseries_columns
-Parameter weiterhin verwenden. score_batch
unterstützt jetzt denenv_manager
-Parameter. Weitere Informationen finden Sie in der MLflow-Dokumentation.
databricks-feature-engineering 0.5.0
- Neue API
update_feature_spec
indatabricks-feature-engineering
, mit der Benutzer den Besitzer eines FeatureSpec im Unity-Katalog aktualisieren können.
databricks-feature-engineering 0.4.0
- Kleine Fehlerbehebungen und Verbesserungen.
databricks-feature-engineering 0.3.0
log_model
verwendet jetzt das neue databricks-feature-lookup PyPI-Paket, das Leistungsverbesserungen für die Onlinemodellbereitstellung enthält.
databricks-feature-store 0.17.0
databricks-feature-store
ist veraltet. Alle vorhandenen Module in diesem Paket sind indatabricks-feature-engineering
Version 0.2.0 und höher verfügbar. Weitere Informationen finden Sie unter Python-API.
databricks-feature-engineering 0.2.0
databricks-feature-engineering
enthält jetzt alle Module ausdatabricks-feature-store
. Weitere Informationen finden Sie unter Python-API.
databricks-feature-store 0.16.3
- Behebt einen Timeoutfehler bei Verwendung von AutoML mit Featuretabellen.
databricks-feature-engineering 0.1.3
- Kleine Verbesserungen bei UpgradeClient.
databricks-feature-store 0.16.2
- Sie können jetzt Feature and Function Serving-Endpunkte erstellen. Ausführliche Informationen finden Sie unter Feature and Function Serving.
databricks-feature-store 0.16.1
- Kleine Fehlerbehebungen und Verbesserungen.
databricks-feature-engineering 0.1.2 & databricks-feature-store 0.16.0
- Kleine Fehlerbehebungen und Verbesserungen.
- Falsche Auftragsherkunfts-URLs korrigiert, die bei bestimmten Arbeitsbereichssetups protokolliert wurden.
databricks-feature-engineering 0.1.1
- Kleine Fehlerbehebungen und Verbesserungen.
databricks-feature-engineering 0.1.0
- GA-Version von Feature Engineering im Unity Catalog-Python-Client auf PyPI
databricks-feature-store 0.15.1
- Kleine Fehlerbehebungen und Verbesserungen.
databricks-feature-store 0.15.0
- Sie können jetzt automatisch Rückschlüsse aus einem Eingabebeispiel ziehen und das Beispiel protokollieren, wenn Sie ein Modell protokollieren. Legen Sie dazu
infer_model_example
aufTrue
fest, wenn Sielog_model
aufrufen. Das Beispiel basiert auf den im Parametertraining_set
angegebenen Trainingsdaten.
databricks-feature-store 0.14.2
- Behebung eines Fehlers bei der Veröffentlichung in Aurora MySQL von MariaDB-Connector/J >=2.7.5.
databricks-feature-store 0.14.1
- Kleine Fehlerbehebungen und Verbesserungen.
databricks-feature-store 0.14.0
Ab 0.14.0 müssen Sie Zeitstempelschlüsselspalten im Argument primary_keys
angeben. Zeitstempelschlüssel sind Teil der „Primärschlüssel“, die jede Zeile in der Featuretabelle eindeutig identifizieren. Wie andere Primärschlüsselspalten dürfen Zeitstempelschlüsselspalten keine NULL-Werte enthalten.
Im folgenden Beispiel enthält der Datenrahmen user_features_df
die folgenden Spalten: user_id
, ts
, purchases_30d
und is_free_trial_active
.
0.14.0 und höher
fs = FeatureStoreClient()
fs.create_table(
name="ads_team.user_features",
primary_keys=["user_id", "ts"],
timestamp_keys="ts",
features_df=user_features_df,
)
0.13.1 und früher
fs = FeatureStoreClient()
fs.create_table(
name="ads_team.user_features",
primary_keys="user_id",
timestamp_keys="ts",
features_df=user_features_df,
)
databricks-feature-store 0.13.1
- Kleine Fehlerbehebungen und Verbesserungen.
databricks-feature-store 0.13.0
- Version 2.4.0 ist jetzt die mindestens erforderliche
mlflow-skinny
-Version. - Das Erstellen eines Trainingssatzes schlägt fehl, wenn der bereitgestellte DataFrame nicht alle erforderlichen Nachschlageschlüssel enthält.
- Beim Protokollieren eines Modells, das Featuretabellen in Unity Catalog verwendet, wird automatisch eine MLflow-Signatur mit dem Modell protokolliert.
databricks-feature-store 0.12.0
- Sie können jetzt einen Online-Shop mithilfe der
drop_online_table
-API löschen.
databricks-feature-store 0.11.0
- In Unity Catalog-fähigen Arbeitsbereichen können Sie jetzt sowohl Arbeitsbereiche als auch Unity Catalog-Featuretabellen in Cosmos DB-Online-Stores veröffentlichen. Dies erfordert Databricks Runtime 13.0 ML oder höher.
databricks-feature-store 0.10.0
- Kleine Fehlerbehebungen und Verbesserungen.
databricks-feature-store 0.9.0
- Kleine Fehlerbehebungen und Verbesserungen.
databricks-feature-store 0.8.0
- Kleine Fehlerbehebungen und Verbesserungen.
databricks-feature-store 0.7.1
flask
als Abhängigkeit hinzugefügt, um das Problem fehlender Abhängigkeiten beim Bewerten von Modellen mitscore_batch
zu beheben.
databricks-feature-store 0.7.0
- Kleine Fehlerbehebungen und Verbesserungen.
databricks-feature-store 0.6.1
- Erste veröffentlichte Version des Databricks-Featurespeicher-Clients in PyPI.