Dela via


Versionsanteckningar för Databricks funktionsteknik och äldre funktionslager för arbetsyta

På den här sidan visas versioner av Databricks Feature Engineering i Unity Catalog-klienten och Databricks Workspace Feature Store-klienten. Båda klienterna är tillgängliga i PyPI som databricks-feature-engineering.

Biblioteken används för att:

  • Skapa, läsa och skriva funktionen tables.
  • Träna modeller på funktionsdata.
  • Publicera funktionen tables på onlinebutiker för att användas i realtid.

Information om användningsdokumentation finns i Databricks Feature Store. Information om Python API-dokumentation finns i Python API.

Feature Engineering i Unity Catalog-klienten fungerar för funktioner och egenskaper tables i Unity Catalog. Arbetsytans funktionslagerklient fungerar för funktioner och funktion tables i Arbetsytans funktionslager. Båda klienterna är förinstallerade i Databricks Runtime för Machine Learning. De kan också köras på Databricks Runtime efter installation databricks-feature-engineering från PyPI (pip install databricks-feature-engineering). Endast för enhetstestning kan båda klienterna användas lokalt eller i CI/CD-miljöer.

En table som visar klientversionskompatibilitet med Databricks Runtime- och Databricks Runtime ML-versioner finns i funktionsteknikers kompatibilitetsmatris. Äldre versioner av Databricks Workspace Feature Store-klienten är tillgängliga i PyPI som databricks-feature-store.

databricks-feature-engineering 0.8.0

  • Stöd för användning av params i score_batch anrop, vilket gör att ytterligare parameters kan skickas till modellen för slutsatsdragning.
  • Felkorrigeringar och förbättringar

databricks-feature-engineering 0.7.0

  • Vissa views i Unity Catalog kan nu användas som funktion tables för offlinemodellträning och utvärdering. Se Läsa från en funktion table i Unity Catalog.
  • Träningsuppsättningar kan nu skapas med funktionssökningar eller en funktionsspecifikation. Se Python SDK-referensen.

databricks-feature-engineering 0.6.0

  • Det finns nu stöd för att köra punkt-i-tid-kopplingar med inbyggd Spark, förutom befintligt stöd med Tempo. Stort tack till Semyon Sinchenko för att föreslå idén!
  • StructType stöds nu som en PySpark-datatyp. StructType stöds inte för onlineservering.
  • write_table stöder nu skrivning till tables som har flytande klustring aktiverat.
  • Parametern timeseries_columns för create_table har bytt namn till timeseries_column. Befintliga arbetsflöden kan fortsätta att använda parametern timeseries_columns .
  • score_batch stöder nu parametern env_manager . Mer information finns i MLflow-dokumentationen .

databricks-feature-engineering 0.5.0

  • Ny API-update_feature_spec i databricks-feature-engineering som gör det möjligt för användare att update ägaren till en FeatureSpec i Unity Catalog.

databricks-feature-engineering 0.4.0

  • Små felkorrigeringar och förbättringar.

databricks-feature-engineering 0.3.0

databricks-feature-store 0.17.0

  • databricks-feature-store är inaktuell. Alla befintliga moduler i det här paketet är tillgängliga i databricks-feature-engineering version 0.2.0 och senare. Mer information finns i Python API.

databricks-feature-engineering 0.2.0

  • databricks-feature-engineering innehåller nu alla moduler från databricks-feature-store. Mer information finns i Python API.

databricks-feature-store 0.16.3

  • Åtgärdar timeout-fel när du använder AutoML med funktion tables.

databricks-feature-engineering 0.1.3

  • Små förbättringar i UpgradeClient.

databricks-feature-store 0.16.2

databricks-feature-store 0.16.1

  • Små felkorrigeringar och förbättringar.

databricks-feature-engineering 0.1.2 & databricks-feature-store 0.16.0

  • Små felkorrigeringar och förbättringar.
    • Åtgärdade felaktiga url:er för jobbursprung som loggats med vissa konfigurationer av arbetsytan.

databricks-feature-engineering 0.1.1

  • Små felkorrigeringar och förbättringar.

databricks-feature-engineering 0.1.0

  • GA-lansering av Feature Engineering i Unity Catalog Python-klient för PyPI

databricks-feature-store 0.15.1

  • Små felkorrigeringar och förbättringar.

databricks-feature-store 0.15.0

  • Nu kan du automatiskt härleda och logga ett indataexempel när du loggar en modell. Det gör du genom att setinfer_model_exampleTrue när du anropar log_model. Exemplet baseras på träningsdata som anges i parametern training_set .

databricks-feature-store 0.14.2

  • Åtgärda fel vid publicering till Aurora MySQL från MariaDB Connector/J >=2.7.5.

databricks-feature-store 0.14.1

  • Små felkorrigeringar och förbättringar.

databricks-feature-store 0.14.0

Från och med 0.14.0 måste du ange tidsstämpelnyckeln columns i argumentet primary_keys. Tidsstämpelnycklar är en del av de "primära nycklar" som unikt identifierar varje rad i funktionen table. Precis som andra primärnyckel columnskan tidsstämpelnyckeln columns inte innehålla NULL-values.

I följande exempel innehåller DataFrame-user_features_df följande columns: user_id, ts, purchases_30doch is_free_trial_active.

0.14.0 och senare

fs = FeatureStoreClient()

fs.create_table(
name="ads_team.user_features",
primary_keys=["user_id", "ts"],
timestamp_keys="ts",
features_df=user_features_df,
)

0.13.1 och lägre

fs = FeatureStoreClient()

fs.create_table(
name="ads_team.user_features",
primary_keys="user_id",
timestamp_keys="ts",
features_df=user_features_df,
)

databricks-feature-store 0.13.1

  • Små felkorrigeringar och förbättringar.

databricks-feature-store 0.13.0

  • Den lägsta version som krävs mlflow-skinny är nu 2.4.0.
  • Det går inte att skapa en utbildning set om den angivna DataFrame inte innehåller alla nödvändiga uppslagsnycklar.
  • När du loggar en modell som använder funktionen tables i Unity Catalogloggas en MLflow-signatur automatiskt med modellen.

databricks-feature-store 0.12.0

  • Nu kan du ta bort en onlinebutik med hjälp av API:et drop_online_table .

databricks-feature-store 0.11.0

  • I Unity Catalog-aktiverade arbetsytor kan du nu publicera både arbetsytan och Unity Catalog-funktionen tables till Cosmos DB-butiker online. Detta kräver Databricks Runtime 13.0 ML eller senare.

databricks-feature-store 0.10.0

  • Små felkorrigeringar och förbättringar.

databricks-feature-store 0.9.0

  • Små felkorrigeringar och förbättringar.

databricks-feature-store 0.8.0

  • Små felkorrigeringar och förbättringar.

databricks-feature-store 0.7.1

  • Lägg till flask som ett beroende för att åtgärda problem med saknade beroenden vid bedömning av modeller med score_batch.

databricks-feature-store 0.7.0

  • Små felkorrigeringar och förbättringar.

databricks-feature-store 0.6.1

  • Första offentliga versionen av Databricks Feature Store-klienten till PyPI.