Udostępnij za pośrednictwem


Informacje o wersji dotyczące inżynierii funkcji usługi Databricks i starszego magazynu funkcji obszaru roboczego

Na tej stronie wymieniono wydania Databricks Feature Engineering w kliencie Unity Catalog oraz Databricks Workspace Feature Store. Oba klienci są dostępni w interfejsie PyPI jako databricks-feature-engineering.

Biblioteki są używane do:

  • Tworzenie, odczytywanie i zapisywanie tabel funkcji.
  • Trenowanie modeli na danych funkcji.
  • Publikuj tabele funkcji w sklepach internetowych, aby zapewnić obsługę w czasie rzeczywistym.

Aby uzyskać dokumentację użycia, zobacz Magazyn funkcji usługi Databricks. Aby uzyskać dokumentację interfejsu API języka Python, zobacz Interfejs API języka Python.

Klient Unity Catalog do inżynierii cech działa na rzecz cech i tablic cech w Unity Catalog. Klient magazynu funkcji obszaru roboczego działa w przypadku funkcji i tabel funkcji w magazynie funkcji obszaru roboczego. Oba klienci są wstępnie zainstalowani w środowisku Databricks Runtime na potrzeby uczenia maszynowego. Mogą również działać w środowisku Databricks Runtime po zainstalowaniu databricks-feature-engineering z poziomu PyPI (pip install databricks-feature-engineering). Tylko w przypadku testów jednostkowych oba klientów mogą być używane lokalnie lub w środowiskach ciągłej integracji/ciągłego wdrażania.

Aby zapoznać się z tabelą przedstawiającą zgodność wersji klienta ze środowiskami Databricks Runtime i Databricks Runtime ML, zobacz macierz zgodności inżynierii funkcji. Starsze wersje klienta magazynu funkcji obszaru roboczego usługi Databricks są dostępne w interfejsie PyPI jako databricks-feature-store.

databricks-feature-engineering 0.8.0

  • Obsługa używania params w wywołaniach score_batch, co umożliwia przekazywanie dodatkowych parametrów do modelu na potrzeby wnioskowania.
  • Poprawki i ulepszenia błędów

databricks-feature-engineering 0.7.0

  • Niektóre widoki w Unity Catalog mogą być teraz używane jako tabele cech na potrzeby trenowania i oceny modelu offline. Zobacz Odczyt z tabeli cech w Unity Catalog.
  • Zestawy szkoleniowe można teraz tworzyć przy użyciu odnośników funkcji lub specyfikacji funkcji. Zobacz dokumentację zestawu SDK języka Python.

databricks-feature-engineering 0.6.0

  • Uruchamianie sprzężeń punkt-w czasie z natywną platformą Spark jest teraz obsługiwane poza istniejącą obsługą rozwiązania Tempo. Ogromne dzięki Semyon Sinchenko za sugerowanie pomysłu!
  • StructType Jest teraz obsługiwany jako typ danych PySpark. StructType nie jest obsługiwana w przypadku obsługi online.
  • write_table obsługuje teraz zapisywanie w tabelach, które mają włączoną płynne klastrowanie.
  • Nazwa parametru timeseries_columns dla create_table elementu została zmieniona na timeseries_column. Istniejące przepływy pracy mogą nadal używać parametru timeseries_columns .
  • score_batch teraz obsługuje env_manager parametr . Aby uzyskać więcej informacji, zobacz dokumentację platformy MLflow.

databricks-feature-engineering 0.5.0

  • Nowe API update_feature_spec w databricks-feature-engineering, które umożliwia użytkownikom aktualizację właściciela FeatureSpec w Unity Catalog.

databricks-feature-engineering 0.4.0

  • Małe poprawki błędów i ulepszenia.

databricks-feature-engineering 0.3.0

databricks-feature-store 0.17.0

  • databricks-feature-store jest przestarzały. Wszystkie istniejące moduły w tym pakiecie są dostępne w databricks-feature-engineering wersji 0.2.0 lub nowszej. Aby uzyskać szczegółowe informacje, zobacz Interfejs API języka Python.

databricks-feature-engineering 0.2.0

  • databricks-feature-engineering teraz zawiera wszystkie moduły z programu databricks-feature-store. Aby uzyskać szczegółowe informacje, zobacz Interfejs API języka Python.

databricks-feature-store 0.16.3

  • Naprawia błąd przekroczenia limitu czasu podczas korzystania z rozwiązania AutoML z tabelami funkcji.

databricks-feature-engineering 0.1.3

  • Małe ulepszenia elementu UpgradeClient.

databricks-feature-store 0.16.2

  • Teraz możesz utworzyć punkty końcowe funkcji i obsługi funkcji. Aby uzyskać szczegółowe informacje, zobacz Funkcja i obsługa funkcji.

databricks-feature-store 0.16.1

  • Małe poprawki błędów i ulepszenia.

databricks-feature-engineering 0.1.2 i databricks-feature-store 0.16.0

  • Małe poprawki błędów i ulepszenia.
    • Naprawiono nieprawidłowe adresy URL pochodzenia zadań zarejestrowane przy użyciu niektórych ustawień obszaru roboczego.

databricks-feature-engineering 0.1.1

  • Małe poprawki błędów i ulepszenia.

databricks-feature-engineering 0.1.0

  • Ogólnie dostępna wersja opracowywania funkcji w kliencie języka Python katalogu Unity w PyPI.

databricks-feature-store 0.15.1

  • Małe poprawki błędów i ulepszenia.

databricks-feature-store 0.15.0

  • Teraz możesz automatycznie wnioskować i rejestrować przykład danych wejściowych podczas rejestrowania modelu. W tym celu ustaw infer_model_example na True, gdy wywołujesz log_model. Przykład jest oparty na danych treningowych określonych w parametrze training_set .

databricks-feature-store 0.14.2

  • Usunięto usterkę podczas publikowania w programie Aurora MySQL z łącznika MariaDB/J >=2.7.5.

databricks-feature-store 0.14.1

  • Małe poprawki błędów i ulepszenia.

databricks-feature-store 0.14.0

Począwszy od wersji 0.14.0, należy określić kolumny klucza sygnatury czasowej w argumencie primary_keys. Klucze sygnatury czasowej są częścią "kluczy podstawowych", które jednoznacznie identyfikują każdy wiersz w tabeli funkcji. Podobnie jak inne kolumny klucza podstawowego, kolumny klucza sygnatury czasowej nie mogą zawierać wartości NULL.

W poniższym przykładzie user_features_df DataFrame zawiera następujące kolumny: user_id, ts, purchases_30di is_free_trial_active.

0.14.0 i nowsze

fs = FeatureStoreClient()

fs.create_table(
name="ads_team.user_features",
primary_keys=["user_id", "ts"],
timestamp_keys="ts",
features_df=user_features_df,
)

0.13.1 i poniżej

fs = FeatureStoreClient()

fs.create_table(
name="ads_team.user_features",
primary_keys="user_id",
timestamp_keys="ts",
features_df=user_features_df,
)

databricks-feature-store 0.13.1

  • Małe poprawki błędów i ulepszenia.

databricks-feature-store 0.13.0

  • Minimalna wymagana mlflow-skinny wersja to teraz 2.4.0.
  • Tworzenie zestawu szkoleniowego kończy się niepowodzeniem, jeśli podana ramka danych nie zawiera wszystkich wymaganych kluczy wyszukiwania.
  • Podczas rejestrowania modelu korzystającego z tabel cech w Unity Catalog, podpis MLflow jest automatycznie rejestrowany razem z modelem.

databricks-feature-store 0.12.0

  • Teraz możesz usunąć sklep online przy użyciu interfejsu drop_online_table API.

databricks-feature-store 0.11.0

  • W przestrzeniach roboczych z obsługą wykazu Unity można teraz publikować tabele funkcjonalności zarówno obszaru roboczego, jak i wykazu Unity do sklepów online usługi Cosmos DB. Wymaga to środowiska Databricks Runtime 13.0 ML lub nowszego.

databricks-feature-store 0.10.0

  • Małe poprawki błędów i ulepszenia.

databricks-feature-store 0.9.0

  • Małe poprawki błędów i ulepszenia.

databricks-feature-store 0.8.0

  • Małe poprawki błędów i ulepszenia.

databricks-feature-store 0.7.1

  • Dodaj flask jako zależność, aby rozwiązać problem z brakującą zależnością podczas oceniania modeli za pomocą polecenia score_batch.

databricks-feature-store 0.7.0

  • Małe poprawki błędów i ulepszenia.

databricks-feature-store 0.6.1

  • Początkowa publiczna wersja klienta magazynu funkcji usługi Databricks do interfejsu PyPI.