Compartilhar via


Etapa 7. Implantar e monitorar

Este artigo fornece diretrizes de alto nível sobre como implantar e monitorar seu aplicativo RAG de prova de conceito.

Implantar e monitorar

Agora que você já criou sua POC de RAG, a avaliou e aprimorou sua qualidade, chegou a hora de implantar seu aplicativo RAG na produção. É importante observar que isso não significa que você não precisa mais monitorar o desempenho e coletar feedback. Iterar na qualidade continua sendo extremamente importante, mesmo após a implantação, já que tanto os padrões de dados quanto de uso podem mudar ao longo do tempo.

Com o Databricks, sua cadeia está pronta para ser implantada como está usando o Mosaic AI Agent Serving. Confira Implantar um agente para um aplicativo de IA generativa para obter instruções.

Implantação

Uma implantação adequada é crucial para garantir uma operação tranquila e o sucesso da sua solução RAG. A seguir confira as considerações críticas para ter em mente ao implantar seu aplicativo RAG:

  1. Identificar os principais pontos de integração
    • Analise seus sistemas e fluxos de trabalho existentes para determinar onde e como sua solução RAG deve se integrar.
    • Avalie se determinadas integrações são mais críticas ou complexas do que outras e as priorize de acordo.
  2. Implementar o controle de versão e escalabilidade
    • Configure um sistema de controle de versão para seus modelos de modo a habilitar um controle e reversões que possam ser efetuados com facilidade.
    • Projete sua arquitetura de implantação para lidar com o aumento de cargas e ser ampliada com eficiência, aproveitando ferramentas como o Databricks Model Serving.
  3. Garanta a segurança e o controle de acesso
    • Ao implantar sua solução RAG, siga as boas práticas de segurança como, por exemplo, proteger pontos de extremidade e dados confidenciais.
    • Implemente mecanismos adequados de controle de acesso para garantir que somente usuários autorizados possam interagir com sua solução RAG.

Monitoramento

Após ter implantado seu aplicativo RAG, é essencial monitorar seu desempenho. O uso no mundo real pode revelar problemas que talvez não estivessem aparentes durante os testes e avaliações anteriores. Além disso, alterações de dados e requisitos podem afetar o desempenho do aplicativo ao longo do tempo. Confira abaixo práticas de monitoramento importantes a serem seguidas:

  1. Estabelecer um monitoramento de métricas e registros em log
    • Defina as principais métricas de desempenho para monitorar a integridade e a eficácia da sua solução RAG, como precisão, tempos de resposta e utilização de recursos.
    • Implemente um registro em log abrangente para capturar eventos importantes, erros e interações do usuários para fins de depuração e aprimoramento.
  2. Configurar alertas e canais de feedback
    • Configure alertas para que você fique a par das anomalias ou problemas críticos, permitindo uma resolução de problemas proativa.
    • Forneça canais para que os usuários enviem feedback da solução RAG e confira e solucione esses comentários regularmente.
  3. Monitorar e aprimorar continuamente
    • Analise continuamente o desempenho da sua solução RAG usando as métricas de monitoramento estabelecidas.
    • Use os insights obtidos com o monitoramento para promover melhorias e otimizações iterativas para a sua solução RAG.
  4. Realizar verificações de integridade regulares
    • Agende verificações de integridade regulares para identificar e resolver quaisquer possíveis problemas proativamente antes que afetem os usuários.
    • Avalie se determinados componentes ou integrações são mais propensos a apresentar problemas e precisam ser monitorados mais de perto.

< Anterior: Etapa 6.1. Corrigir o pipeline de dados

Voltar para a página de navegação