Passo 6. Fazer & avaliar correções de qualidade no agente de IA
Este artigo orienta você pelas etapas para iterar e avaliar correções de qualidade em seu agente de IA generativo com base na análise de causa raiz.
Para obter mais informações sobre como avaliar um agente de IA, consulte O que é Mosaic AI Agent Evaluation?.
Requisitos
- Com base em sua análise de causa raiz, você identificou possíveis correções para recuperação ou geração para implementar e avaliar.
- Seu aplicativo POC (ou outra cadeia de linha de base) é registrado em uma execução MLflow com uma avaliação de Avaliação de Agente armazenada na mesma execução.
Consulte o repositório GitHub para obter o código de exemplo nesta seção.
Resultados esperados na Avaliação de Agentes
A imagem anterior mostra a saída Avaliação do Agente no MLflow.
Como corrigir, avaliar e iterar no agente de IA
Para todos os tipos, use o bloco de anotações B_quality_iteration/02_evaluate_fixes para avaliar a cadeia resultante versus sua configuração de linha de base, seu POC e escolha um "vencedor". Este bloco de notas ajuda-o a escolher a experiência vencedora e a implementá-la na aplicação de revisão ou numa API REST escalável e pronta para produção.
- No Azure Databricks, abra o bloco de anotações B_quality_iteration/02_evaluate_fixes .
- Com base no tipo de correção que você está implementando:
- Para correções de pipeline de dados:
- Siga a etapa 6 (pipelines). Implemente correções de pipeline de dados para criar o novo pipeline de dados e obter o nome da execução MLflow resultante.
- Adicione o nome da execução à
DATA_PIPELINE_FIXES_RUN_NAMES
variável.
- Para correções de configuração de cadeia:
- Siga as instruções na
Chain configuration
seção do 02_evaluate_fixes bloco de anotações para adicionar correções de configuração de cadeia àCHAIN_CONFIG_FIXES
variável.
- Siga as instruções na
- Para correções de código de cadeia:
- Crie um arquivo de código em cadeia modificado e salve-o na pasta B_quality_iteration/chain_code_fixes . Como alternativa, selecione uma das correções de código de cadeia fornecidas dessa pasta.
- Siga as instruções na
Chain code
seção do 02_evaluate_fixes bloco de anotações para adicionar o arquivo de código de cadeia e qualquer configuração de cadeia adicional que seja necessária para aCHAIN_CODE_FIXES
variável.
- Para correções de pipeline de dados:
- O seguinte acontece quando executa o bloco de notas a
Run evaluation
partir da célula:- Avalie cada correção.
- Determine a correção com as melhores métricas de qualidade/custo/latência.
- Implante o melhor no aplicativo Review e em uma API REST pronta para produção para obter feedback das partes interessadas.
Próximo passo
Continue com a Etapa 6 (pipelines). Implemente correções de pipeline de dados.