Etapa 6. Fazer e avaliar correções de qualidade no agente de IA
Este artigo orienta você pelas etapas para iterar e avaliar correções de qualidade em seu agente de IA generativa com base na análise de causa raiz.
Para obter mais informações sobre como avaliar um agente de IA, consulte O que é a avaliação do agente de IA do Mosaic?.
Requisitos
- Com base na análise da causa raiz, você identificou possíveis correções para a recuperação ou geração a ser implementada e avaliada.
- Seu aplicativo da POC (ou outra cadeia de linha de base) é registrado em uma execução do MLflow com uma avaliação de Avaliação do Agente armazenada na mesma execução.
Consulte o repositório do GitHub para obter o código de exemplo nesta seção.
Resultado esperado na avaliação do agente
A imagem anterior mostra a saída de Avaliação do Agente no MLflow.
Como corrigir, avaliar e iterar no agente de IA
Para todos os tipos, use o notebook B_quality_iteration/02_evaluate_fixes para avaliar a cadeia resultante versus sua configuração de linha de base, sua POC e escolha um “vencedor”. Este notebook ajuda você a escolher o experimento vencedor e implantá-lo no aplicativo de revisão ou em uma API REST escalonável e pronta para produção.
- No Azure Databricks, abra o notebook B_quality_iteration/02_evaluate_fixes .
- Com base no tipo de correção que você está implementando:
- Para correções de pipeline de dados:
- Siga a Etapa 6 (pipelines). Implementar correções de pipeline de dados para criar o novo pipeline de dados e obter o nome da execução resultante do MLflow.
- Adicione o nome da execução à variável
DATA_PIPELINE_FIXES_RUN_NAMES
.
- Para correções de configuração de cadeia:
- Siga as instruções na seção
Chain configuration
do notebook 02_evaluate_fixes para adicionar correções de configuração de cadeia à variávelCHAIN_CONFIG_FIXES
.
- Siga as instruções na seção
- Para correções de código de cadeia:
- Crie um arquivo de código de cadeia modificado e salve-o na pasta B_quality_iteration/chain_code_fixes. Como alternativa, selecione uma das correções de código de cadeia fornecidas nessa pasta.
- Siga as instruções na seção
Chain code
do notebook 02_evaluate_fixes para adicionar o arquivo do código de cadeia e qualquer configuração de cadeia adicional necessários para a variávelCHAIN_CODE_FIXES
.
- Para correções de pipeline de dados:
- O seguinte ocorre quando você executa o notebook na célula
Run evaluation
:- Avalie cada correção.
- Determine a correção com as melhores métricas de qualidade, custo e latência.
- Implante a melhor para o Aplicativo de Revisão e uma API REST pronta para produção para obter comentários de participantes.
Próxima etapa
Continue com a Etapa 6 (pipelines). Implementar correções de pipeline de dados.