Utiliser des invites pour obtenir les conclusions des modèles
Une fois le modèle déployé, vous pouvez tester la façon dont il termine les invites. Une invite est la partie texte d’une requête envoyée au point de terminaison des conclusions du modèle déployé. Les réponses sont appelées conclusions, qui peuvent se présenter sous forme de texte, de code ou d’autres formats.
Types d’invites
Les invites peuvent être regroupées en types de requêtes en fonction de la tâche.
Type de tâche | Exemple d’invite | Exemple de conclusion |
---|---|---|
Classification du contenu | Tweet : j’ai apprécié le voyage. Sentiment : |
Positif |
Génération d’un nouveau contenu | Répertorier les modes de déplacement | 1. Vélo 2. Voiture |
Maintenir une conversation | Un assistant IA convivial | Voir des exemples |
Transformation (traduction et conversion de symboles) | Anglais : Bonjour Français : |
bonjour |
Résumé du contenu | Fournir un résumé du contenu {text} |
Le contenu partage les méthodes de Machine Learning. |
Reprendre là où vous en étiez | Une façon de faire pousser des tomates | consiste à planter des graines. |
Donner des réponses factuelles | Combien de lunes la Terre a-t-elle ? | Un |
Qualité de la conclusion
Plusieurs facteurs affectent la qualité des conclusions que vous obtiendrez d’une solution d’IA générative.
- La façon dont une invite est conçue. En savoir plus sur l’ingénierie des invites ici.
- Paramètres du modèle (abordés ci-après)
- Les données sur lesquelles l’apprentissage du modèle est effectué, qui peuvent être adaptées par le biais d’un réglage précis du modèle avec personnalisation
Vous avez plus de contrôle sur les conclusions retournées par l’apprentissage d’un modèle personnalisé que par l’ingénierie d’invite et l’ajustement des paramètres.
Établissement des appels
Vous pouvez commencer à effectuer des appels à votre modèle déployé via l’API REST, Python, C# ou à partir de Studio. Si votre modèle déployé a une base de modèle GPT-3.5 ou GPT-4, utilisez la documentation sur les compléments de conversation instantanée, qui dispose de variables et de points de terminaison de requête différents de ceux d’autres modèles de base.