Étape 6. Définir et évaluer les correctifs de qualité sur l’agent IA

Article
11/19/2024

Cet article vous guide tout au long des étapes permettant d’itérer et d’évaluer les correctifs de qualité dans votre agent IA générative en fonction de l’analyse de la cause racine.

Diagramme de flux de travail POC, étape d’itération

Pour plus d’informations sur l’évaluation d’un agent IA, consultez Qu’est-ce que l’évaluation de l’agent d’IA de Mosaïque ?.

Spécifications

Sur la base de votre analyse de la cause racine, vous avez identifié des correctifs potentiels à implémenter et à évaluer pour la récupération ou la génération.
Votre application de preuve de concept (POC) (ou une autre chaîne de référence) est enregistrée dans une exécution MLflow avec une évaluation Évaluation de l’agent stockée dans la même exécution.

Consultez le dépôt GitHub pour obtenir l’exemple de code de cette section.

Résultat attendu dans l’évaluation de l’agent

GIF animé montrant la sortie d’une exécution d’évaluation de l’agent dans Databricks MLflow.

L’image précédente montre la sortie d’évaluation de l’agent dans MLflow.

Comment corriger, évaluer et itérer sur l’agent IA

Pour tous les types, utilisez le notebook B_quality_iteration/02_evaluate_fixes pour évaluer la chaîne résultante par rapport à votre configuration de base de référence et votre POC, et choisissez un « vainqueur ». Ce notebook vous aide à choisir l’expérience gagnante et à la déployer sur l’application de révision ou sur une API REST évolutive prête pour la production.

Dans Azure Databricks, ouvrez le notebook B_quality_iteration/02_evaluate_fixes .
En fonction du type de correctif que vous implémentez :
- Pour les correctifs de pipeline de données :
  - Suivez Étape 6 (pipelines). Implémenter des correctifs de pipeline de données pour créer le nouveau pipeline de données et obtenir le nom de l’exécution MLflow résultante.
  - Ajoutez le nom d’exécution à la variable DATA_PIPELINE_FIXES_RUN_NAMES.
- Pour les correctifs de configuration de chaîne :
  - Suivez les instructions de la section Chain configuration du notebook 02_evaluate_fixes pour ajouter des correctifs de configuration de chaîne à la variable CHAIN_CONFIG_FIXES.
- Pour les correctifs de code de chaîne :
  - Créez un fichier de code de chaîne modifié et enregistrez-le dans le dossier B_quality_iteration/chain_code_fixes. Vous pouvez également sélectionner l’un des correctifs de code de chaîne fournis à partir de ce dossier.
  - Suivez les instructions de la section Chain code du notebook 02_evaluate_fixes pour ajouter le fichier de code de chaîne et toute configuration de chaîne supplémentaire requise à la variable CHAIN_CODE_FIXES.
Voici ce qui se produit lorsque vous exécutez le notebook à partir de la cellule Run evaluation :
- Évaluez chaque correctif.
- Déterminez le correctif offrant les métriques de qualité/coût/latence optimales.
- Déployez le meilleur correctif sur l’application de révision et sur une API REST prête pour la production afin d’obtenir les commentaires de la part des parties prenantes.

Étape suivante

Passez à l’Étape 6 (pipelines). Implémenter des correctifs de pipeline de données.

< Précédent : Étape 5.2. Qualité de génération de débogage

Suivant : Étape 6.1. Corriger le pipeline de données >

Partager via

Étape 6. Définir et évaluer les correctifs de qualité sur l’agent IA

Spécifications

Résultat attendu dans l’évaluation de l’agent

Comment corriger, évaluer et itérer sur l’agent IA

Étape suivante

Commentaires

Ressources supplémentaires