Partilhar via


Notas de versão para a engenharia de características do Databricks e o repositório de características do espaço de trabalho legado

Esta página lista as versões do cliente Databricks Feature Engineering no Unity Catalog e do cliente Databricks Workspace Feature Store. Ambos os clientes estão disponíveis no PyPI como databricks-feature-engineering.

As bibliotecas estão habituadas a:

  • Crie, leia e escreva tabelas de recursos.
  • Treine modelos em dados de recursos.
  • Publique tabelas de recursos em lojas online para atendimento em tempo real.

Para obter a documentação de uso, consulte Databricks Feature Store. Para obter a documentação da API do Python, consulte API do Python.

O cliente Feature Engineering no Unity Catalog funciona para recursos e tabelas de recursos no Unity Catalog. O cliente do Repositório de Recursos de Espaço de Trabalho funciona para recursos e tabelas de recursos no Repositório de Recursos de Espaço de Trabalho. Ambos os clientes são pré-instalados no Databricks Runtime for Machine Learning. Eles também podem ser executados no Databricks Runtime após a instalação databricks-feature-engineering a partir do PyPI (pip install databricks-feature-engineering). Apenas para testes de unidade, ambos os clientes podem ser usados localmente ou em ambientes CI/CD.

Para obter uma tabela mostrando a compatibilidade da versão do cliente com as versões Databricks Runtime e Databricks Runtime ML, consulte Matriz de compatibilidade de engenharia de recursos. Versões mais antigas do cliente Databricks Workspace Feature Store estão disponíveis no PyPI como databricks-feature-store.

Databricks-Feature-Engineering 0.8.0

  • Suporte ao usar params nas invocações de score_batch, o que permite que parâmetros adicionais sejam passados para o modelo para inferir resultados.
  • Correções de bugs e melhorias

Databricks-Feature-Engineering 0.7.0

  • Certas visualizações no Unity Catalog agora podem ser usadas como tabelas de recursos para treinamento e avaliação de modelos offline. Consulte Ler a partir de uma tabela de recursos no Catálogo Unity.
  • Os conjuntos de treinamento agora podem ser criados com pesquisas de recursos ou uma especificação de recurso. Consulte a referência do SDK do Python.

Databricks-Feature-Engineering 0.6.0

  • A execução de junções point-in-time com o Spark nativo agora é suportada, além do suporte existente com o Tempo. Muito obrigado a Semyon Sinchenko por sugerir a ideia!
  • StructType agora é suportado como um tipo de dados PySpark. StructType não é suportado para serviço online.
  • write_table agora suporta a gravação em tabelas que têm clustering líquido habilitado .
  • O timeseries_columns parâmetro for create_table foi renomeado para timeseries_column. Os fluxos de trabalho existentes podem continuar a usar o timeseries_columns parâmetro.
  • score_batch agora suporta o env_manager parâmetro. Consulte a documentação do MLflow para obter mais informações.

Databricks-Feature-Engineering 0.5.0

  • Nova API update_feature_spec que databricks-feature-engineering permite aos usuários atualizar o proprietário de um FeatureSpec no Unity Catalog.

Databricks-Feature-Engineering 0.4.0

  • Pequenas correções de bugs e melhorias.

Databricks-Feature-Engineering 0.3.0

databricks-feature-store 0.17.0

  • databricks-feature-store foi preterido. Todos os módulos existentes neste pacote estão disponíveis na databricks-feature-engineering versão 0.2.0 e superior. Para obter detalhes, consulte Python API.

Databricks-Feature-Engineering 0.2.0

  • databricks-feature-engineering agora contém todos os módulos do databricks-feature-store. Para obter detalhes, consulte Python API.

databricks-feature-store 0.16.3

  • Corrige bugs de tempo limite ao usar o AutoML com tabelas de recursos.

Databricks-Feature-Engineering 0.1.3

  • Pequenas melhorias no UpgradeClient.

databricks-feature-store 0.16.2

  • Agora você pode criar pontos de extremidade Feature & Function Servindo. Para obter detalhes, consulte Feature & Function Serving.

databricks-feature-store 0.16.1

  • Pequenas correções de bugs e melhorias.

databricks-feature-engineering 0.1.2 & databricks-feature-store 0.16.0

  • Pequenas correções de bugs e melhorias.
    • Corrigidas URLs de linhagem de trabalho incorretas registradas com determinadas configurações de espaço de trabalho.

Databricks-Feature-Engineering 0.1.1

  • Pequenas correções de bugs e melhorias.

Databricks-Feature-Engineering 0.1.0

  • Versão GA do Feature Engineering no cliente Python do Unity Catalog para PyPI

databricks-feature-store 0.15.1

  • Pequenas correções de bugs e melhorias.

databricks-feature-store 0.15.0

  • Agora você pode inferir e registrar automaticamente um exemplo de entrada ao registrar um modelo. Para fazer isso, defina infer_model_example como True quando você chamar log_model. O exemplo é baseado nos dados de treinamento especificados no training_set parâmetro.

databricks-feature-store 0.14.2

  • Corrigir bug na publicação no Aurora MySQL do MariaDB Connector/J >= 2.7.5.

databricks-feature-store 0.14.1

  • Pequenas correções de bugs e melhorias.

Databricks-Feature-Store 0.14.0

A partir de 0.14.0, você deve especificar colunas de chave de carimbo de primary_keys data/hora no argumento. As chaves de carimbo de data/hora fazem parte das "chaves primárias" que identificam exclusivamente cada linha na tabela de recursos. Como outras colunas de chave primária, as colunas de chave de carimbo de data/hora não podem conter valores NULL.

No exemplo a seguir, o DataFrame user_features_df contém as seguintes colunas: user_id, ts, purchases_30de is_free_trial_active.

0.14.0 e superior

fs = FeatureStoreClient()

fs.create_table(
name="ads_team.user_features",
primary_keys=["user_id", "ts"],
timestamp_keys="ts",
features_df=user_features_df,
)

0.13.1 e inferior

fs = FeatureStoreClient()

fs.create_table(
name="ads_team.user_features",
primary_keys="user_id",
timestamp_keys="ts",
features_df=user_features_df,
)

databricks-feature-store 0.13.1

  • Pequenas correções de bugs e melhorias.

databricks-feature-store 0.13.0

  • A versão mínima necessária mlflow-skinny é agora 2.4.0.
  • A criação de um conjunto de treinamento falhará se o DataFrame fornecido não contiver todas as chaves de pesquisa necessárias.
  • Ao registrar um modelo que usa tabelas de recursos no Unity Catalog, uma assinatura MLflow é registrada automaticamente com o modelo.

databricks-feature-store 0.12.0

  • Agora você pode excluir uma loja online usando a drop_online_table API.

databricks-feature-store 0.11.0

  • Nos espaços de trabalho habilitados para Catálogo Unity, agora você pode publicar tabelas de recursos do espaço de trabalho e do Catálogo Unity nas lojas online do Cosmos DB. Isso requer o Databricks Runtime 13.0 ML ou superior.

databricks-feature-store 0.10.0

  • Pequenas correções de bugs e melhorias.

databricks-feature-store 0.9.0

  • Pequenas correções de bugs e melhorias.

Databricks-Feature-Store 0.8.0

  • Pequenas correções de bugs e melhorias.

Databricks-Feature-Store 0.7.1

  • Adicione flask como uma dependência para corrigir o problema de dependência ausente ao pontuar modelos com score_batcho .

Databricks-Feature-Store 0.7.0

  • Pequenas correções de bugs e melhorias.

databricks-feature-store 0.6.1

  • Lançamento público inicial do cliente Databricks Feature Store para o PyPI.