Exemplo de engenharia de recursos: aplicação RAG estruturada
A geração aumentada por recuperação, ou RAG, é uma das abordagens mais comuns para a construção de aplicações de IA generativas. A engenharia de recursos no Unity Catalog suporta aplicativos RAG estruturados usando tabelas on-line. Você cria uma tabela online para os dados estruturados de que o aplicativo RAG precisa e hospeda-a em um ponto de extremidade de serviço de recurso. O aplicativo RAG usa o recurso que serve o ponto de extremidade para procurar dados relevantes da tabela online.
As etapas típicas são as seguintes:
- Crie um ponto de extremidade de serviço de recurso.
- Crie uma LangChainTool que use o ponto de extremidade para procurar dados relevantes.
- Use a ferramenta no agente LangChain para recuperar dados relevantes.
- Crie um modelo de ponto de extremidade de serviço para hospedar o aplicativo LangChain.
O bloco de anotações a seguir ilustra como usar tabelas on-line Databricks e pontos de extremidade de serviço de recursos para aplicativos de geração aumentada (RAG) de recuperação.