Exemplo de engenharia de recursos: aplicativo RAG estruturado
A geração aumentada por recuperação, ou RAG, é uma das abordagens mais comuns para a criação de aplicativos de IA generativa. A engenharia de recursos no Catálogo do Unity dá suporte a aplicativos RAG estruturados usando tabelas online. Crie uma tabela online para os dados estruturados necessários pelo aplicativo RAG e a hospede em um ponto de extremidade de fornecimento de recursos. O aplicativo RAG utiliza o ponto de extremidade de fornecimento de recursos para consultar dados relevantes na tabela online.
As etapas típicas são as seguintes:
- Criar um ponto de extremidade de fornecimento de recursos.
- Crie uma LangChainTool que use o ponto de extremidade para pesquisar dados relevantes.
- Use a ferramenta no agente LangChain para recuperar dados relevantes.
- Crie um ponto de extremidade de fornecimento de modelos para hospedar o aplicativo LangChain.
O notebook a seguir ilustra como usar as tabelas online do Databricks e os pontos de extremidade fornecidos por recursos para aplicativos de geração aumentada de recuperação (RAG).