Partilhar via


Exemplo de engenharia de recursos: aplicação RAG estruturada

A geração aumentada por recuperação, ou RAG, é uma das abordagens mais comuns para a construção de aplicações de IA generativas. A engenharia de recursos no Unity Catalog suporta aplicativos RAG estruturados usando tabelas on-line. Você cria uma tabela online para os dados estruturados de que o aplicativo RAG precisa e hospeda-a em um ponto de extremidade de serviço de recurso. O aplicativo RAG usa o recurso que serve o ponto de extremidade para procurar dados relevantes da tabela online.

As etapas típicas são as seguintes:

  1. Crie um ponto de extremidade de serviço de recurso.
  2. Crie uma LangChainTool que use o ponto de extremidade para procurar dados relevantes.
  3. Use a ferramenta no agente LangChain para recuperar dados relevantes.
  4. Crie um modelo de ponto de extremidade de serviço para hospedar o aplicativo LangChain.

O bloco de anotações a seguir ilustra como usar tabelas on-line Databricks e pontos de extremidade de serviço de recursos para aplicativos de geração aumentada (RAG) de recuperação.

Tabelas online com caderno de demonstração de aplicações RAG

Obter o bloco de notas