Partilhar via


Repositório de recursos do espaço de trabalho (legado)

Nota

Esta documentação abrange o Workspace Feature Store. O Repositório de Recursos de Espaço de Trabalho está disponível apenas para espaços de trabalho criados antes de 19 de agosto de 2024, 16:00:00 (UTC).

A Databricks recomenda o uso do Feature Engineering no Unity Catalog. O Repositório de Recursos da Área de Trabalho será descontinuado no futuro.

Por que usar o Workspace Feature Store?

O Repositório de Recursos de Espaço de Trabalho é totalmente integrado com outros componentes do Azure Databricks.

  • Capacidade de descoberta. A interface do usuário do Feature Store, acessível a partir do espaço de trabalho Databricks, permite navegar e pesquisar recursos existentes.
  • Linhagem. Quando você cria uma tabela de recursos no Azure Databricks, as fontes de dados usadas para criar a tabela de recursos são salvas e acessíveis. Para cada característica em uma tabela de características, também pode aceder aos modelos, cadernos de notas, trabalhos e endpoints que usam a característica.
  • Integração com avaliação e disponibilização de modelos. Quando você usa recursos do Feature Store para treinar um modelo, o modelo é empacotado com metadados de recurso. Quando você usa o modelo para pontuação em lote ou inferência online, ele recupera automaticamente os recursos do Feature Store. O chamador não precisa saber sobre eles ou incluir lógica para pesquisar ou integrar funcionalidades para pontuar novos dados. Isso torna a implantação e as atualizações do modelo muito mais fáceis.
  • Pesquisas point-in-time. O Feature Store suporta séries temporais e casos de uso baseados em eventos que exigem precisão no momento exato.

Como funciona o Workspace Feature Store?

O fluxo de trabalho típico de aprendizado de máquina usando o Feature Store segue este caminho:

  1. Escreva código para converter dados brutos em recursos e crie um Spark DataFrame contendo os recursos desejados.
  2. Escreva o DataFrame como uma tabela de recursos no Repositório de Recursos de Espaço de Trabalho.
  3. Treine um modelo utilizando características do repositório de características. Quando você faz isso, o modelo armazena as especificações dos recursos usados para treinamento. Quando o modelo é usado para inferência, ele une automaticamente recursos das tabelas de recursos apropriadas.
  4. Registar modelo no Registo de Modelos.

Agora você pode usar o modelo para fazer previsões sobre novos dados. Para casos de uso em lote, o modelo recupera automaticamente os recursos necessários do Feature Store.

Fluxo de trabalho do Feature Store para casos de uso de aprendizado de máquina em lote.

Para casos de uso de atendimento em tempo real, publique os recursos em uma loja online. Consulte Lojas online de terceiros.

No momento da inferência, o modelo recolhe recursos pré-computados da loja online e combina-os com os dados fornecidos na solicitação do cliente ao endpoint de serviço do modelo.

Fluxo do Repositório de Recursos para modelos de aprendizado de máquina que são servidos.

Começar a usar a Loja de Funcionalidades do Workspace

Para começar, experimente estes blocos de notas de exemplo. O bloco de anotações básico orienta você sobre como criar uma tabela de recursos, usá-la para treinar um modelo e, em seguida, executar a pontuação em lote usando a pesquisa automática de recursos. Ele também apresenta a interface do usuário de engenharia de recursos e mostra como você pode usá-la para pesquisar recursos e entender como os recursos são criados e usados.

Bloco de anotações de exemplo do Repositório de Recursos de Espaço de Trabalho Básico

Obter caderno

O notebook de exemplo de táxi ilustra o processo de criação de características, atualizando-as e usando-as para treinamento de modelo e inferência em lote.

Exemplo de bloco de notas do repositório de recursos do espaço de trabalho para táxis

Obter caderno

Tipos de dados suportados:

Para tipos de dados suportados, consulte Tipos de dados suportados.