Informacje o wersji dotyczące inżynierii funkcji usługi Databricks i starszego magazynu funkcji obszaru roboczego
Na tej stronie wymieniono wydania Databricks Feature Engineering w kliencie Unity Catalog oraz Databricks Workspace Feature Store. Oba klienci są dostępni w interfejsie PyPI jako databricks-feature-engineering.
Biblioteki są używane do:
- Tworzenie, odczytywanie i zapisywanie tabel funkcji.
- Trenowanie modeli na danych funkcji.
- Publikuj tabele funkcji w sklepach internetowych, aby zapewnić obsługę w czasie rzeczywistym.
Aby uzyskać dokumentację użycia, zobacz Magazyn funkcji usługi Databricks. Aby uzyskać dokumentację interfejsu API języka Python, zobacz Interfejs API języka Python.
Klient Unity Catalog do inżynierii cech działa na rzecz cech i tablic cech w Unity Catalog. Klient magazynu funkcji obszaru roboczego działa w przypadku funkcji i tabel funkcji w magazynie funkcji obszaru roboczego. Oba klienci są wstępnie zainstalowani w środowisku Databricks Runtime na potrzeby uczenia maszynowego. Mogą również działać w środowisku Databricks Runtime po zainstalowaniu databricks-feature-engineering
z poziomu PyPI (pip install databricks-feature-engineering
). Tylko w przypadku testów jednostkowych oba klientów mogą być używane lokalnie lub w środowiskach ciągłej integracji/ciągłego wdrażania.
Aby zapoznać się z tabelą przedstawiającą zgodność wersji klienta ze środowiskami Databricks Runtime i Databricks Runtime ML, zobacz macierz zgodności inżynierii funkcji. Starsze wersje klienta magazynu funkcji obszaru roboczego usługi Databricks są dostępne w interfejsie PyPI jako databricks-feature-store.
databricks-feature-engineering 0.8.0
- Obsługa używania
params
w wywołaniachscore_batch
, co umożliwia przekazywanie dodatkowych parametrów do modelu na potrzeby wnioskowania. - Poprawki i ulepszenia błędów
databricks-feature-engineering 0.7.0
- Niektóre widoki w Unity Catalog mogą być teraz używane jako tabele cech na potrzeby trenowania i oceny modelu offline. Zobacz Odczyt z tabeli cech w Unity Catalog.
- Zestawy szkoleniowe można teraz tworzyć przy użyciu odnośników funkcji lub specyfikacji funkcji. Zobacz dokumentację zestawu SDK języka Python.
databricks-feature-engineering 0.6.0
- Uruchamianie sprzężeń punkt-w czasie z natywną platformą Spark jest teraz obsługiwane poza istniejącą obsługą rozwiązania Tempo. Ogromne dzięki Semyon Sinchenko za sugerowanie pomysłu!
-
StructType
Jest teraz obsługiwany jako typ danych PySpark.StructType
nie jest obsługiwana w przypadku obsługi online. -
write_table
obsługuje teraz zapisywanie w tabelach, które mają włączoną płynne klastrowanie. - Nazwa parametru
timeseries_columns
dlacreate_table
elementu została zmieniona natimeseries_column
. Istniejące przepływy pracy mogą nadal używać parametrutimeseries_columns
. -
score_batch
teraz obsługujeenv_manager
parametr . Aby uzyskać więcej informacji, zobacz dokumentację platformy MLflow.
databricks-feature-engineering 0.5.0
- Nowe API
update_feature_spec
wdatabricks-feature-engineering
, które umożliwia użytkownikom aktualizację właściciela FeatureSpec w Unity Catalog.
databricks-feature-engineering 0.4.0
- Małe poprawki błędów i ulepszenia.
databricks-feature-engineering 0.3.0
-
log_model
Teraz używa nowego pakietu PyPI databricks-feature-lookup , który obejmuje ulepszenia wydajności obsługi modeli online.
databricks-feature-store 0.17.0
-
databricks-feature-store
jest przestarzały. Wszystkie istniejące moduły w tym pakiecie są dostępne wdatabricks-feature-engineering
wersji 0.2.0 lub nowszej. Aby uzyskać szczegółowe informacje, zobacz Interfejs API języka Python.
databricks-feature-engineering 0.2.0
-
databricks-feature-engineering
teraz zawiera wszystkie moduły z programudatabricks-feature-store
. Aby uzyskać szczegółowe informacje, zobacz Interfejs API języka Python.
databricks-feature-store 0.16.3
- Naprawia błąd przekroczenia limitu czasu podczas korzystania z rozwiązania AutoML z tabelami funkcji.
databricks-feature-engineering 0.1.3
- Małe ulepszenia elementu UpgradeClient.
databricks-feature-store 0.16.2
- Teraz możesz utworzyć punkty końcowe funkcji i obsługi funkcji. Aby uzyskać szczegółowe informacje, zobacz Funkcja i obsługa funkcji.
databricks-feature-store 0.16.1
- Małe poprawki błędów i ulepszenia.
databricks-feature-engineering 0.1.2 i databricks-feature-store 0.16.0
- Małe poprawki błędów i ulepszenia.
- Naprawiono nieprawidłowe adresy URL pochodzenia zadań zarejestrowane przy użyciu niektórych ustawień obszaru roboczego.
databricks-feature-engineering 0.1.1
- Małe poprawki błędów i ulepszenia.
databricks-feature-engineering 0.1.0
- Ogólnie dostępna wersja opracowywania funkcji w kliencie języka Python katalogu Unity w PyPI.
databricks-feature-store 0.15.1
- Małe poprawki błędów i ulepszenia.
databricks-feature-store 0.15.0
- Teraz możesz automatycznie wnioskować i rejestrować przykład danych wejściowych podczas rejestrowania modelu. W tym celu ustaw
infer_model_example
naTrue
, gdy wywołujeszlog_model
. Przykład jest oparty na danych treningowych określonych w parametrzetraining_set
.
databricks-feature-store 0.14.2
- Usunięto usterkę podczas publikowania w programie Aurora MySQL z łącznika MariaDB/J >=2.7.5.
databricks-feature-store 0.14.1
- Małe poprawki błędów i ulepszenia.
databricks-feature-store 0.14.0
Począwszy od wersji 0.14.0, należy określić kolumny klucza sygnatury czasowej w argumencie primary_keys
. Klucze sygnatury czasowej są częścią "kluczy podstawowych", które jednoznacznie identyfikują każdy wiersz w tabeli funkcji. Podobnie jak inne kolumny klucza podstawowego, kolumny klucza sygnatury czasowej nie mogą zawierać wartości NULL.
W poniższym przykładzie user_features_df
DataFrame zawiera następujące kolumny: user_id
, ts
, purchases_30d
i is_free_trial_active
.
0.14.0 i nowsze
fs = FeatureStoreClient()
fs.create_table(
name="ads_team.user_features",
primary_keys=["user_id", "ts"],
timestamp_keys="ts",
features_df=user_features_df,
)
0.13.1 i poniżej
fs = FeatureStoreClient()
fs.create_table(
name="ads_team.user_features",
primary_keys="user_id",
timestamp_keys="ts",
features_df=user_features_df,
)
databricks-feature-store 0.13.1
- Małe poprawki błędów i ulepszenia.
databricks-feature-store 0.13.0
- Minimalna wymagana
mlflow-skinny
wersja to teraz 2.4.0. - Tworzenie zestawu szkoleniowego kończy się niepowodzeniem, jeśli podana ramka danych nie zawiera wszystkich wymaganych kluczy wyszukiwania.
- Podczas rejestrowania modelu korzystającego z tabel cech w Unity Catalog, podpis MLflow jest automatycznie rejestrowany razem z modelem.
databricks-feature-store 0.12.0
- Teraz możesz usunąć sklep online przy użyciu interfejsu
drop_online_table
API.
databricks-feature-store 0.11.0
- W przestrzeniach roboczych z obsługą wykazu Unity można teraz publikować tabele funkcjonalności zarówno obszaru roboczego, jak i wykazu Unity do sklepów online usługi Cosmos DB. Wymaga to środowiska Databricks Runtime 13.0 ML lub nowszego.
databricks-feature-store 0.10.0
- Małe poprawki błędów i ulepszenia.
databricks-feature-store 0.9.0
- Małe poprawki błędów i ulepszenia.
databricks-feature-store 0.8.0
- Małe poprawki błędów i ulepszenia.
databricks-feature-store 0.7.1
- Dodaj
flask
jako zależność, aby rozwiązać problem z brakującą zależnością podczas oceniania modeli za pomocą poleceniascore_batch
.
databricks-feature-store 0.7.0
- Małe poprawki błędów i ulepszenia.
databricks-feature-store 0.6.1
- Początkowa publiczna wersja klienta magazynu funkcji usługi Databricks do interfejsu PyPI.