Passo 4. Avaliar a qualidade do POC

Artigo
12/21/2024

fluxo de trabalho com a etapa de avaliação realçada

Consulte o repositório GitHub para obter o código de exemplo nesta seção.

Tempo previsto: 5 - 60 minutos. O tempo varia de acordo com o número de perguntas do seu conjunto de avaliação. Para 100 perguntas, a avaliação leva aproximadamente 5 minutos.

Visão geral e resultados esperados

Esta etapa usa o conjunto de avaliação que você acabou de selecionar para avaliar seu aplicativo POC e estabelecer a qualidade, o custo e a latência da linha de base. Os resultados da avaliação são usados pela próxima etapa para identificar a causa raiz de quaisquer problemas de qualidade.

A avaliação é feita usando Mosaic AI Agent Evaluation e analisa de forma abrangente todos os aspetos de qualidade, custo e latência descritos na seção métricas deste tutorial.

As métricas agregadas e a avaliação de cada pergunta no conjunto de avaliação são registradas no MLflow. Para obter detalhes, consulte Resultados da avaliação.

Requisitos

O conjunto de avaliação está disponível.
Todos os requisitos das etapas anteriores.

Instruções

Abra o 05_evaluate_poc_quality bloco de anotações no diretório POC escolhido e clique em Executar tudo.
Inspecione os resultados da avaliação no caderno ou usando MLflow. Se os resultados atenderem aos seus requisitos de qualidade, você poderá pular diretamente para Implantar e monitorar. Como o aplicativo POC é construído em Databricks, ele está pronto para ser implantado em uma API REST escalável e pronta para produção.

Próximo passo

Usando essa avaliação de linha de base da qualidade do POC, identifique as causas raiz de quaisquer problemas de qualidade e corrija iterativamente esses problemas para melhorar o aplicativo. Consulte o Passo 5. Identifique a causa raiz dos problemas de qualidade.

< Anterior: Passo 3. Organize um conjunto de avaliação

Seguinte: Passo 5. Identificar as causas dos problemas de qualidade >

Partilhar via

Passo 4. Avaliar a qualidade do POC

Visão geral e resultados esperados

Requisitos

Instruções

Próximo passo

Comentários

Recursos adicionais