Ce navigateur n’est plus pris en charge.
Effectuez une mise à niveau vers Microsoft Edge pour tirer parti des dernières fonctionnalités, des mises à jour de sécurité et du support technique.
Vous avez un ensemble spécifique de questions et vous souhaitez vérifier que votre application de conversation y répond correctement. Quelle est la meilleure évaluation pour vérifier cela ?
Points de référence de modèle
Évaluations manuelles
Métriques de Machine Learning
Quel benchmarck de modèle quantifie la similarité sémantique entre une source de base et la réponse générée ?
Similarité GPT
Cohérence
Précision
Vous souhaitez évaluer dan quelle mesure le texte généré respecte les règles grammaticales. Quel type d’évaluation conviendrait le mieux ?
Évaluations automatisées
Métriques de risque et de sécurité
Vous devez répondre à toutes les questions avant de vérifier votre travail.
Cette page a-t-elle été utile ?