Compartilhar via


Etapa 5 (geração). Como depurar a qualidade de geração

Essa página descreve como identificar a causa raiz dos problemas de geração. Use essa página quando a análise de causa raiz indicar uma causa raiz Improve Generation.

Mesmo com uma recuperação otimizada, se o componente LLM de uma cadeia RAG não conseguir utilizar o contexto recuperado com eficácia para gerar respostas corretas, coerentes e relevantes, a qualidade final do resultado será afetada. Algumas das formas que os problemas de qualidade de geração podem assumir são as alucinações, inconsistências ou falhas ao abordar a consulta do usuário com concisão.

Instruções

Siga essas etapas para abordar problemas de qualidade de geração:

  1. Abra o notebook B_quality_iteration/01_root_cause_quality_issues.
  2. Use as consultas para carregar os indícios de MLflow dos registros que apresentaram problemas de qualidade de geração.
  3. Para cada registro, examine manualmente a resposta gerada e a compare com o contexto recuperado e a resposta de referência.
  4. Procure padrões ou problemas comuns nas consultas com baixa qualidade de geração. Por exemplo:
    • Geração de informações não presentes no contexto recuperado.
    • Geração de informações que não são consistentes com o contexto recuperado (alucinação).
    • Falha ao abordar diretamente a consulta do usuário considerando o contexto recuperado fornecido.
    • Geração de respostas que são excessivamente detalhadas, difíceis de entender ou sem coerência lógica.
  5. Com base no problema identificado, crie hipóteses de possíveis causas raiz e as correções correspondentes. Para obter diretrizes, confira Razões comuns para uma geração de qualidade insuficiente.
  6. Siga as etapas em implementar e avaliar as alterações para implementar e avaliar uma possível correção. Isso pode envolver a modificação da cadeia RAG (por exemplo, ajustar o modelo de prompt ou experimentar uma LLM diferente) ou o pipeline de dados (por exemplo, ajustar a estratégia de fragmentação para fornecer mais contexto).
  7. Se a qualidade de geração ainda não for satisfatória, repita as etapas 4 e 5 para a próxima correção mais promissora, até que o desempenho desejado seja alcançado.
  8. Execute novamente a análise de causa raiz para determinar se a cadeia de modo geral tem alguma causa raiz adicional que deve ser abordada.

Motivos comuns para uma geração de qualidade insuficiente

A tabela a seguir lista as etapas de depuração e possíveis correções para problemas comuns de geração. As correções são categorizadas por componente:

  • Configuração de cadeia
  • Código de cadeia

O componente define quais etapas você deve seguir na etapa implementar e avaliar as alterações.

Importante

O Databricks recomenda que você use a engenharia de prompt para iterar na qualidade dos resultados do aplicativo. A maioria das etapas a seguir usa a engenharia de prompt.

Problema de geração Etapas de depuração Possível correção
As informações geradas não estão presentes no contexto recuperado (como, por exemplo, nas alucinações). - Compare as respostas geradas ao contexto recuperado para identificar informações alucinadas.
- Avalie se determinados tipos de consultas ou contextos recuperados são mais propensos a alucinações.
- Configuração de cadeia Atualize o modelo de prompt para enfatizar a confiança no contexto recuperado.
- Configuração de cadeia Use um LLM mais capaz.
- Código de cadeia Implemente uma verificação de fatos ou uma etapa de verificação de fatos após a geração.
Falha ao abordar diretamente a consulta do usuário ou fornecimento de respostas excessivamente genéricas - Compare as respostas geradas às consultas de usuário para avaliar a relevância e a especificidade.
- Verifique se determinados tipos de consultas resultam na recuperação do contexto correto, mas o LLM está produzindo resultados de baixa qualidade.
- Configuração de cadeia Melhore o modelo de prompt para incentivar respostas diretas e específicas.
- Configuração de cadeia Recupere um contexto mais direcionado ao melhorar o processo de recuperação.
- Código de cadeia Reclassifique os resultados da recuperação para posicionar as partes mais relevantes em primeiro lugar, forneça-os apenas ao LLM.
- Configuração de cadeia Use um LLM mais capaz.
As respostas geradas são difíceis de entender ou sem fluxo lógico - Avalie a saída quanto ao fluxo lógico, a correção gramatical e ao reconhecimento.
- Analise se a incoerência ocorre com mais frequência em determinados tipos de consultas ou quando determinados tipos de contexto são recuperados.
- Configuração de cadeia Altere o modelo de prompt para incentivar uma resposta coerente e bem estruturada.
- Configuração de cadeia Forneça mais contexto ao LLM recuperando partes relevantes adicionais.
- Configuração de cadeia Use um LLM mais capaz.
As respostas geradas não estão no formato ou estilo desejados - Compare a saída ao formato esperado e às diretrizes de estilo.
- Avalie se determinados tipos de consultas ou contextos recuperados são mais propensos a desvios de formato ou estilo.
- Configuração de cadeia Atualize o modelo de prompt para especificar o formato e o estilo de saída desejados.
- Código de cadeia Implemente uma etapa de pós-processamento para converter a resposta gerada no formato desejado.
- Código de cadeia Adicione uma etapa para validar a estrutura e o estilo de saída, além de gerar uma resposta de fallback, se necessário.
- Configuração de cadeia Use um LLM ajustado para fornecer saídas em um formato ou estilo específico.

Próxima etapa

Se você também identificou problemas com a qualidade de recuperação, prossiga para a Etapa 5 (recuperação). Como depurar a qualidade da recuperação.

Se você acha que resolveu todos os problemas identificados, continue com a Etapa 6. Faça e avalie correções de qualidade no agente de IA.

< Anterior: Etapa 5.1. Depurar a qualidade da recuperação

Próximo: Etapa 6. Corrigir problemas de qualidade iterativamente >