Compartilhar via


Exemplo de engenharia de recursos: aplicativo RAG estruturado

A geração aumentada por recuperação, ou RAG, é uma das abordagens mais comuns para a criação de aplicativos de IA generativa. A engenharia de recursos no Catálogo do Unity dá suporte a aplicativos RAG estruturados usando tabelas online. Crie uma tabela online para os dados estruturados necessários pelo aplicativo RAG e a hospede em um ponto de extremidade de fornecimento de recursos. O aplicativo RAG utiliza o ponto de extremidade de fornecimento de recursos para consultar dados relevantes na tabela online.

As etapas típicas são as seguintes:

  1. Criar um ponto de extremidade de fornecimento de recursos.
  2. Crie uma LangChainTool que use o ponto de extremidade para pesquisar dados relevantes.
  3. Use a ferramenta no agente LangChain para recuperar dados relevantes.
  4. Crie um ponto de extremidade de fornecimento de modelos para hospedar o aplicativo LangChain.

O notebook a seguir ilustra como usar as tabelas online do Databricks e os pontos de extremidade fornecidos por recursos para aplicativos de geração aumentada de recuperação (RAG).

Tabelas online com aplicativos RAG em um notebook de demonstração

Obter notebook