Condividi tramite


Note sulla versione per la progettazione delle funzionalità di Databricks e l'archivio delle funzionalità dell'area di lavoro legacy

Questa pagina elenca le versioni del client Databricks Feature Engineering nel Unity Catalog e del client Databricks Workspace Feature Store. Entrambi i client sono disponibili in PyPI come databricks-feature-engineering.

Le librerie vengono usate per:

  • Creare, leggere e scrivere tabelle di caratteristiche.
  • Eseguire il training dei modelli sui dati delle funzionalità.
  • Pubblicare tabelle delle caratteristiche nei negozi online per la disponibilità in tempo reale.

Per la documentazione sull'utilizzo, vedere Archivio funzionalità di Databricks. Per la documentazione dell'API Python, vedere API Python.

Il client di Feature Engineering in Unity Catalog funziona per le caratteristiche e le tabelle delle caratteristiche in Unity Catalog. Il client di Workspace Feature Store funziona per le feature e le tabelle di feature in Workspace Feature Store. Entrambi i client sono preinstallati in Databricks Runtime per Machine Learning. Possono anche essere eseguiti in Databricks Runtime dopo l'installazione databricks-feature-engineering da PyPI (pip install databricks-feature-engineering). Solo per gli unit test, entrambi i client possono essere usati in locale o in ambienti CI/CD.

Per una tabella che mostra la compatibilità delle versioni client con Databricks Runtime e le versioni di Databricks Runtime ML, vedere matrice di compatibilità di Progettazione delle funzionalità. Le versioni precedenti del client archivio delle funzionalità dell'area di lavoro di Databricks sono disponibili in PyPI come databricks-feature-store.

databricks-feature-engineering 0.8.0

  • Supporto dell'uso di params nelle chiamate score_batch, che consente di passare parametri aggiuntivi al modello per l'inferenza.
  • Correzioni di bug e miglioramenti

databricks-feature-engineering 0.7.0

  • Alcune viste in Unity Catalog possono ora essere usate come tabelle delle funzionalità per il training e la valutazione dei modelli offline. Consulta Leggere da una tabella delle caratteristiche in Unity Catalog.
  • È ora possibile creare set di training con ricerche di funzionalità o specifiche di funzionalità. Vedere le informazioni di riferimento su Python SDK.

databricks-feature-engineering 0.6.0

  • L'esecuzione di join temporizzato con Spark nativo è ora supportata, oltre al supporto esistente con Tempo. Grazie enorme a Semyon Sinchenko per suggerire l'idea!
  • StructType è ora supportato come tipo di dati PySpark. StructType non è supportato per la gestione online.
  • write_table supporta ora la scrittura in tabelle con clustering liquido abilitato.
  • Il timeseries_columns parametro per create_table è stato rinominato in timeseries_column. I flussi di lavoro esistenti possono continuare a usare il timeseries_columns parametro .
  • score_batch supporta ora il env_manager parametro . Per altre informazioni, vedere la documentazione di MLflow.

databricks-feature-engineering 0.5.0

  • Nuova API update_feature_spec in databricks-feature-engineering che permette agli utenti di aggiornare il proprietario di una FeatureSpec in Unity Catalog.

databricks-feature-engineering 0.4.0

  • Piccole correzioni di bug e miglioramenti.

databricks-feature-engineering 0.3.0

databricks-feature-store 0.17.0

  • databricks-feature-store è stato deprecato. Tutti i moduli esistenti in questo pacchetto sono disponibili nella databricks-feature-engineering versione 0.2.0 e successive. Per informazioni dettagliate, vedere API Python.

databricks-feature-engineering 0.2.0

  • databricks-feature-engineering ora contiene tutti i moduli da databricks-feature-store. Per informazioni dettagliate, vedere API Python.

databricks-feature-store 0.16.3

  • Corregge il bug di timeout quando si usa AutoML con le tabelle delle funzionalità.

databricks-feature-engineering 0.1.3

  • Piccoli miglioramenti in UpgradeClient.

databricks-feature-store 0.16.2

  • È ora possibile creare endpoint di funzionalità e di gestione delle funzioni. Per informazioni dettagliate, vedere Funzionalità e gestione delle funzioni.

databricks-feature-store 0.16.1

  • Piccole correzioni di bug e miglioramenti.

databricks-feature-engineering 0.1.2 & databricks-feature-store 0.16.0

  • Piccole correzioni di bug e miglioramenti.
    • Correzione di URL di derivazione del processo non corretti registrati con determinate configurazioni dell'area di lavoro.

databricks-feature-engineering 0.1.1

  • Piccole correzioni di bug e miglioramenti.

databricks-feature-engineering 0.1.0

  • Rilascio generale dell'Ingegneria delle Caratteristiche nel client Python di Unity Catalog su PyPI

databricks-feature-store 0.15.1

  • Piccole correzioni di bug e miglioramenti.

databricks-feature-store 0.15.0

  • È ora possibile dedurre e registrare automaticamente un esempio di input quando si registra un modello. A tale scopo, imposta infer_model_example a True quando si chiama log_model. L'esempio si basa sui dati di training specificati nel training_set parametro .

databricks-feature-store 0.14.2

  • Correzione del bug nella pubblicazione in Aurora MySQL dal connettore MariaDB/J >=2.7.5.

databricks-feature-store 0.14.1

  • Piccole correzioni di bug e miglioramenti.

databricks-feature-store 0.14.0

A partire dalla versione 0.14.0, è necessario specificare colonne con chiave di timestamp nell'argomento primary_keys. Le chiavi timestamp fanno parte delle "chiavi primarie" che identificano in modo univoco ogni riga nella tabella delle funzionalità. Analogamente ad altre colonne chiave primaria, le colonne chiave timestamp non possono contenere valori NULL.

Nell'esempio seguente il dataframe user_features_df contiene le colonne seguenti: user_id, ts, purchases_30de is_free_trial_active.

0.14.0 e versioni successive

fs = FeatureStoreClient()

fs.create_table(
name="ads_team.user_features",
primary_keys=["user_id", "ts"],
timestamp_keys="ts",
features_df=user_features_df,
)

0.13.1 e versioni successive

fs = FeatureStoreClient()

fs.create_table(
name="ads_team.user_features",
primary_keys="user_id",
timestamp_keys="ts",
features_df=user_features_df,
)

databricks-feature-store 0.13.1

  • Piccole correzioni di bug e miglioramenti.

databricks-feature-store 0.13.0

  • L versione mlflow-skinny minima richiesta è ora 2.4.0.
  • La creazione di un set di addestramento ha esito negativo se il DataFrame specificato non contiene tutte le chiavi di ricerca necessarie.
  • Quando si registra un modello che usa tabelle delle funzionalità in Unity Catalog, una firma MLflow viene registrata automaticamente con il modello.

databricks-feature-store 0.12.0

  • È ora possibile eliminare un archivio online usando l'API drop_online_table .

databricks-feature-store 0.11.0

  • Nelle aree di lavoro abilitate per il Catalogo Unity, è ora possibile pubblicare le tabelle delle funzionalità sia del workspace che del Catalogo Unity negli archivi online di Cosmos DB. Ciò richiede Databricks Runtime 13.0 ML o versione successiva.

databricks-feature-store 0.10.0

  • Piccole correzioni di bug e miglioramenti.

databricks-feature-store 0.9.0

  • Piccole correzioni di bug e miglioramenti.

databricks-feature-store 0.8.0

  • Piccole correzioni di bug e miglioramenti.

databricks-feature-store 0.7.1

  • Aggiungere flask come dipendenza per risolvere il problema di dipendenza mancante durante l'assegnazione dei punteggi ai modelli con score_batch.

databricks-feature-store 0.7.0

  • Piccole correzioni di bug e miglioramenti.

databricks-feature-store 0.6.1

  • Versione pubblica iniziale del client di Databricks Feature Store in PyPI.