Note sulla versione per la progettazione delle funzionalità di Databricks e l'archivio delle funzionalità dell'area di lavoro legacy
Questa pagina elenca le versioni del client Databricks Feature Engineering nel Unity Catalog e del client Databricks Workspace Feature Store. Entrambi i client sono disponibili in PyPI come databricks-feature-engineering.
Le librerie vengono usate per:
- Creare, leggere e scrivere tabelle di caratteristiche.
- Eseguire il training dei modelli sui dati delle funzionalità.
- Pubblicare tabelle delle caratteristiche nei negozi online per la disponibilità in tempo reale.
Per la documentazione sull'utilizzo, vedere Archivio funzionalità di Databricks. Per la documentazione dell'API Python, vedere API Python.
Il client di Feature Engineering in Unity Catalog funziona per le caratteristiche e le tabelle delle caratteristiche in Unity Catalog. Il client di Workspace Feature Store funziona per le feature e le tabelle di feature in Workspace Feature Store. Entrambi i client sono preinstallati in Databricks Runtime per Machine Learning. Possono anche essere eseguiti in Databricks Runtime dopo l'installazione databricks-feature-engineering
da PyPI (pip install databricks-feature-engineering
). Solo per gli unit test, entrambi i client possono essere usati in locale o in ambienti CI/CD.
Per una tabella che mostra la compatibilità delle versioni client con Databricks Runtime e le versioni di Databricks Runtime ML, vedere matrice di compatibilità di Progettazione delle funzionalità. Le versioni precedenti del client archivio delle funzionalità dell'area di lavoro di Databricks sono disponibili in PyPI come databricks-feature-store.
databricks-feature-engineering 0.8.0
- Supporto dell'uso di
params
nelle chiamatescore_batch
, che consente di passare parametri aggiuntivi al modello per l'inferenza. - Correzioni di bug e miglioramenti
databricks-feature-engineering 0.7.0
- Alcune viste in Unity Catalog possono ora essere usate come tabelle delle funzionalità per il training e la valutazione dei modelli offline. Consulta Leggere da una tabella delle caratteristiche in Unity Catalog.
- È ora possibile creare set di training con ricerche di funzionalità o specifiche di funzionalità. Vedere le informazioni di riferimento su Python SDK.
databricks-feature-engineering 0.6.0
- L'esecuzione di join temporizzato con Spark nativo è ora supportata, oltre al supporto esistente con Tempo. Grazie enorme a Semyon Sinchenko per suggerire l'idea!
-
StructType
è ora supportato come tipo di dati PySpark.StructType
non è supportato per la gestione online. -
write_table
supporta ora la scrittura in tabelle con clustering liquido abilitato. - Il
timeseries_columns
parametro percreate_table
è stato rinominato intimeseries_column
. I flussi di lavoro esistenti possono continuare a usare iltimeseries_columns
parametro . -
score_batch
supporta ora ilenv_manager
parametro . Per altre informazioni, vedere la documentazione di MLflow.
databricks-feature-engineering 0.5.0
- Nuova API
update_feature_spec
indatabricks-feature-engineering
che permette agli utenti di aggiornare il proprietario di una FeatureSpec in Unity Catalog.
databricks-feature-engineering 0.4.0
- Piccole correzioni di bug e miglioramenti.
databricks-feature-engineering 0.3.0
-
log_model
ora usa il nuovo pacchetto PyPI databricks-feature-lookup , che include miglioramenti delle prestazioni per la gestione dei modelli online.
databricks-feature-store 0.17.0
-
databricks-feature-store
è stato deprecato. Tutti i moduli esistenti in questo pacchetto sono disponibili nelladatabricks-feature-engineering
versione 0.2.0 e successive. Per informazioni dettagliate, vedere API Python.
databricks-feature-engineering 0.2.0
-
databricks-feature-engineering
ora contiene tutti i moduli dadatabricks-feature-store
. Per informazioni dettagliate, vedere API Python.
databricks-feature-store 0.16.3
- Corregge il bug di timeout quando si usa AutoML con le tabelle delle funzionalità.
databricks-feature-engineering 0.1.3
- Piccoli miglioramenti in UpgradeClient.
databricks-feature-store 0.16.2
- È ora possibile creare endpoint di funzionalità e di gestione delle funzioni. Per informazioni dettagliate, vedere Funzionalità e gestione delle funzioni.
databricks-feature-store 0.16.1
- Piccole correzioni di bug e miglioramenti.
databricks-feature-engineering 0.1.2 & databricks-feature-store 0.16.0
- Piccole correzioni di bug e miglioramenti.
- Correzione di URL di derivazione del processo non corretti registrati con determinate configurazioni dell'area di lavoro.
databricks-feature-engineering 0.1.1
- Piccole correzioni di bug e miglioramenti.
databricks-feature-engineering 0.1.0
- Rilascio generale dell'Ingegneria delle Caratteristiche nel client Python di Unity Catalog su PyPI
databricks-feature-store 0.15.1
- Piccole correzioni di bug e miglioramenti.
databricks-feature-store 0.15.0
- È ora possibile dedurre e registrare automaticamente un esempio di input quando si registra un modello. A tale scopo, imposta
infer_model_example
aTrue
quando si chiamalog_model
. L'esempio si basa sui dati di training specificati neltraining_set
parametro .
databricks-feature-store 0.14.2
- Correzione del bug nella pubblicazione in Aurora MySQL dal connettore MariaDB/J >=2.7.5.
databricks-feature-store 0.14.1
- Piccole correzioni di bug e miglioramenti.
databricks-feature-store 0.14.0
A partire dalla versione 0.14.0, è necessario specificare colonne con chiave di timestamp nell'argomento primary_keys
. Le chiavi timestamp fanno parte delle "chiavi primarie" che identificano in modo univoco ogni riga nella tabella delle funzionalità. Analogamente ad altre colonne chiave primaria, le colonne chiave timestamp non possono contenere valori NULL.
Nell'esempio seguente il dataframe user_features_df
contiene le colonne seguenti: user_id
, ts
, purchases_30d
e is_free_trial_active
.
0.14.0 e versioni successive
fs = FeatureStoreClient()
fs.create_table(
name="ads_team.user_features",
primary_keys=["user_id", "ts"],
timestamp_keys="ts",
features_df=user_features_df,
)
0.13.1 e versioni successive
fs = FeatureStoreClient()
fs.create_table(
name="ads_team.user_features",
primary_keys="user_id",
timestamp_keys="ts",
features_df=user_features_df,
)
databricks-feature-store 0.13.1
- Piccole correzioni di bug e miglioramenti.
databricks-feature-store 0.13.0
- L versione
mlflow-skinny
minima richiesta è ora 2.4.0. - La creazione di un set di addestramento ha esito negativo se il DataFrame specificato non contiene tutte le chiavi di ricerca necessarie.
- Quando si registra un modello che usa tabelle delle funzionalità in Unity Catalog, una firma MLflow viene registrata automaticamente con il modello.
databricks-feature-store 0.12.0
- È ora possibile eliminare un archivio online usando l'API
drop_online_table
.
databricks-feature-store 0.11.0
- Nelle aree di lavoro abilitate per il Catalogo Unity, è ora possibile pubblicare le tabelle delle funzionalità sia del workspace che del Catalogo Unity negli archivi online di Cosmos DB. Ciò richiede Databricks Runtime 13.0 ML o versione successiva.
databricks-feature-store 0.10.0
- Piccole correzioni di bug e miglioramenti.
databricks-feature-store 0.9.0
- Piccole correzioni di bug e miglioramenti.
databricks-feature-store 0.8.0
- Piccole correzioni di bug e miglioramenti.
databricks-feature-store 0.7.1
- Aggiungere
flask
come dipendenza per risolvere il problema di dipendenza mancante durante l'assegnazione dei punteggi ai modelli conscore_batch
.
databricks-feature-store 0.7.0
- Piccole correzioni di bug e miglioramenti.
databricks-feature-store 0.6.1
- Versione pubblica iniziale del client di Databricks Feature Store in PyPI.