Notas de versão para a engenharia de características do Databricks e o repositório de características do espaço de trabalho legado
Esta página lista as versões do cliente Databricks Feature Engineering no Unity Catalog e do cliente Databricks Workspace Feature Store. Ambos os clientes estão disponíveis no PyPI como databricks-feature-engineering.
As bibliotecas estão habituadas a:
- Crie, leia e escreva tabelas de recursos.
- Treine modelos em dados de recursos.
- Publique tabelas de recursos em lojas online para atendimento em tempo real.
Para obter a documentação de uso, consulte Databricks Feature Store. Para obter a documentação da API do Python, consulte API do Python.
O cliente Feature Engineering no Unity Catalog funciona para recursos e tabelas de recursos no Unity Catalog. O cliente do Repositório de Recursos de Espaço de Trabalho funciona para recursos e tabelas de recursos no Repositório de Recursos de Espaço de Trabalho. Ambos os clientes são pré-instalados no Databricks Runtime for Machine Learning. Eles também podem ser executados no Databricks Runtime após a instalação databricks-feature-engineering
a partir do PyPI (pip install databricks-feature-engineering
). Apenas para testes de unidade, ambos os clientes podem ser usados localmente ou em ambientes CI/CD.
Para obter uma tabela mostrando a compatibilidade da versão do cliente com as versões Databricks Runtime e Databricks Runtime ML, consulte Matriz de compatibilidade de engenharia de recursos. Versões mais antigas do cliente Databricks Workspace Feature Store estão disponíveis no PyPI como databricks-feature-store.
Databricks-Feature-Engineering 0.8.0
- Suporte ao usar
params
nas invocações descore_batch
, o que permite que parâmetros adicionais sejam passados para o modelo para inferir resultados. - Correções de bugs e melhorias
Databricks-Feature-Engineering 0.7.0
- Certas visualizações no Unity Catalog agora podem ser usadas como tabelas de recursos para treinamento e avaliação de modelos offline. Consulte Ler a partir de uma tabela de recursos no Catálogo Unity.
- Os conjuntos de treinamento agora podem ser criados com pesquisas de recursos ou uma especificação de recurso. Consulte a referência do SDK do Python.
Databricks-Feature-Engineering 0.6.0
- A execução de junções point-in-time com o Spark nativo agora é suportada, além do suporte existente com o Tempo. Muito obrigado a Semyon Sinchenko por sugerir a ideia!
-
StructType
agora é suportado como um tipo de dados PySpark.StructType
não é suportado para serviço online. -
write_table
agora suporta a gravação em tabelas que têm clustering líquido habilitado . - O
timeseries_columns
parâmetro forcreate_table
foi renomeado paratimeseries_column
. Os fluxos de trabalho existentes podem continuar a usar otimeseries_columns
parâmetro. -
score_batch
agora suporta oenv_manager
parâmetro. Consulte a documentação do MLflow para obter mais informações.
Databricks-Feature-Engineering 0.5.0
- Nova API
update_feature_spec
quedatabricks-feature-engineering
permite aos usuários atualizar o proprietário de um FeatureSpec no Unity Catalog.
Databricks-Feature-Engineering 0.4.0
- Pequenas correções de bugs e melhorias.
Databricks-Feature-Engineering 0.3.0
-
log_model
agora usa o novo pacote PyPI databricks-feature-lookup , que inclui melhorias de desempenho para o serviço de modelos on-line.
databricks-feature-store 0.17.0
-
databricks-feature-store
foi preterido. Todos os módulos existentes neste pacote estão disponíveis nadatabricks-feature-engineering
versão 0.2.0 e superior. Para obter detalhes, consulte Python API.
Databricks-Feature-Engineering 0.2.0
-
databricks-feature-engineering
agora contém todos os módulos dodatabricks-feature-store
. Para obter detalhes, consulte Python API.
databricks-feature-store 0.16.3
- Corrige bugs de tempo limite ao usar o AutoML com tabelas de recursos.
Databricks-Feature-Engineering 0.1.3
- Pequenas melhorias no UpgradeClient.
databricks-feature-store 0.16.2
- Agora você pode criar pontos de extremidade Feature & Function Servindo. Para obter detalhes, consulte Feature & Function Serving.
databricks-feature-store 0.16.1
- Pequenas correções de bugs e melhorias.
databricks-feature-engineering 0.1.2 & databricks-feature-store 0.16.0
- Pequenas correções de bugs e melhorias.
- Corrigidas URLs de linhagem de trabalho incorretas registradas com determinadas configurações de espaço de trabalho.
Databricks-Feature-Engineering 0.1.1
- Pequenas correções de bugs e melhorias.
Databricks-Feature-Engineering 0.1.0
- Versão GA do Feature Engineering no cliente Python do Unity Catalog para PyPI
databricks-feature-store 0.15.1
- Pequenas correções de bugs e melhorias.
databricks-feature-store 0.15.0
- Agora você pode inferir e registrar automaticamente um exemplo de entrada ao registrar um modelo. Para fazer isso, defina
infer_model_example
comoTrue
quando você chamarlog_model
. O exemplo é baseado nos dados de treinamento especificados notraining_set
parâmetro.
databricks-feature-store 0.14.2
- Corrigir bug na publicação no Aurora MySQL do MariaDB Connector/J >= 2.7.5.
databricks-feature-store 0.14.1
- Pequenas correções de bugs e melhorias.
Databricks-Feature-Store 0.14.0
A partir de 0.14.0, você deve especificar colunas de chave de carimbo de primary_keys
data/hora no argumento. As chaves de carimbo de data/hora fazem parte das "chaves primárias" que identificam exclusivamente cada linha na tabela de recursos. Como outras colunas de chave primária, as colunas de chave de carimbo de data/hora não podem conter valores NULL.
No exemplo a seguir, o DataFrame user_features_df
contém as seguintes colunas: user_id
, ts
, purchases_30d
e is_free_trial_active
.
0.14.0 e superior
fs = FeatureStoreClient()
fs.create_table(
name="ads_team.user_features",
primary_keys=["user_id", "ts"],
timestamp_keys="ts",
features_df=user_features_df,
)
0.13.1 e inferior
fs = FeatureStoreClient()
fs.create_table(
name="ads_team.user_features",
primary_keys="user_id",
timestamp_keys="ts",
features_df=user_features_df,
)
databricks-feature-store 0.13.1
- Pequenas correções de bugs e melhorias.
databricks-feature-store 0.13.0
- A versão mínima necessária
mlflow-skinny
é agora 2.4.0. - A criação de um conjunto de treinamento falhará se o DataFrame fornecido não contiver todas as chaves de pesquisa necessárias.
- Ao registrar um modelo que usa tabelas de recursos no Unity Catalog, uma assinatura MLflow é registrada automaticamente com o modelo.
databricks-feature-store 0.12.0
- Agora você pode excluir uma loja online usando a
drop_online_table
API.
databricks-feature-store 0.11.0
- Nos espaços de trabalho habilitados para Catálogo Unity, agora você pode publicar tabelas de recursos do espaço de trabalho e do Catálogo Unity nas lojas online do Cosmos DB. Isso requer o Databricks Runtime 13.0 ML ou superior.
databricks-feature-store 0.10.0
- Pequenas correções de bugs e melhorias.
databricks-feature-store 0.9.0
- Pequenas correções de bugs e melhorias.
Databricks-Feature-Store 0.8.0
- Pequenas correções de bugs e melhorias.
Databricks-Feature-Store 0.7.1
- Adicione
flask
como uma dependência para corrigir o problema de dependência ausente ao pontuar modelos comscore_batch
o .
Databricks-Feature-Store 0.7.0
- Pequenas correções de bugs e melhorias.
databricks-feature-store 0.6.1
- Lançamento público inicial do cliente Databricks Feature Store para o PyPI.