Partilhar via


Geração aumentada de recuperação (RAG) no Azure Cosmos DB

A Geração Aumentada de Recuperação (RAG) combina o poder de grandes modelos de linguagem (LLMs) com sistemas robustos de recuperação de informações para criar respostas mais precisas e contextualmente relevantes. Ao contrário dos modelos generativos tradicionais que dependem apenas de dados pré-treinados, as arquiteturas RAG aprimoram os recursos de um LLM integrando a recuperação de informações em tempo real. Este aumento garante que as respostas não são apenas generativas, mas também fundamentadas nos dados mais relevantes e atualizados disponíveis.

O Azure Cosmos DB, uma base de dados operacional que suporta a pesquisa vetorial, destaca-se como uma excelente plataforma para implementar RAG. Sua capacidade de lidar com cargas de trabalho operacionais e analíticas em um único banco de dados, juntamente com recursos avançados, como multilocação e chaves de partição hierárquicas, fornece uma base sólida para a construção de aplicativos sofisticados de IA generativa.

Principais vantagens de usar o Azure Cosmos DB

Armazenamento e recuperação unificados de dados

O Azure Cosmos DB permite a integração perfeita de recursos de pesquisa vetorial em um sistema de banco de dados unificado. Isso significa que seus dados operacionais e dados vetorizados coexistem, eliminando a necessidade de sistemas de indexação separados.

Ingestão e consulta de dados em tempo real

O Azure Cosmos DB suporta ingestão e consulta em tempo real, tornando-o ideal para aplicações de IA. Isso é crucial para arquiteturas RAG, onde a atualização dos dados pode afetar significativamente a relevância das respostas geradas.

Escalabilidade e distribuição global

Projetado para aplicativos de grande escala, o Azure Cosmos DB oferece distribuição global e dimensionamento automático instantâneo. Isso garante que seu aplicativo habilitado para RAG possa lidar com altos volumes de consulta e oferecer um desempenho consistente, independentemente da localização do usuário.

Disponibilidade e fiabilidade elevadas

O Azure Cosmos DB oferece SLAs abrangentes para taxa de transferência, latência e disponibilidade. Essa confiabilidade garante que seu sistema RAG esteja sempre disponível para gerar respostas com o mínimo de tempo de inatividade.

Multilocação com chaves de partição hierárquicas

O Azure Cosmos DB dá suporte à multilocação por meio de vários modelos de isolamento de desempenho e segurança, facilitando o gerenciamento de dados para diferentes clientes ou grupos de usuários no mesmo banco de dados. Esse recurso é particularmente útil para aplicativos SaaS, onde a separação de dados do locatário é crucial para a segurança e a conformidade.

Elementos de segurança abrangentes

Com recursos internos, como criptografia de ponta a ponta, controle de acesso baseado em função (RBAC) e integração de rede virtual (VNet), o Azure Cosmos DB garante que seus dados permaneçam seguros. Essas medidas de segurança são essenciais para aplicativos RAG de nível empresarial que lidam com informações confidenciais.

Implementando o RAG com o Azure Cosmos DB

Gorjeta

Para exemplos RAG, visite: AzureDataRetrievalAugmentedGenerationSamples

Aqui está um processo simplificado para criar um aplicativo RAG com o Azure Cosmos DB:

  1. Ingestão de dados: armazene seus documentos, imagens e outros tipos de conteúdo no Azure Cosmos DB. Utilize o suporte do banco de dados para pesquisa vetorial para indexar e recuperar conteúdo vetorizado.
  2. Execução de consulta: quando um usuário envia uma consulta, o Azure Cosmos DB pode recuperar rapidamente os dados mais relevantes usando seus recursos de pesquisa vetorial.
  3. Integração LLM: passe os dados recuperados para um LLM (por exemplo, Azure OpenAI) para gerar uma resposta. Os dados bem estruturados fornecidos pelo Cosmos DB melhoram a qualidade da saída do modelo.
  4. Geração de resposta: O LLM processa os dados e gera uma resposta abrangente, que é então entregue ao usuário.