Tester des modèles dans le terrain de jeu d’Azure AI Studio
Les terrains de jeu sont des interfaces utiles dans Azure AI Studio que vous pouvez utiliser pour tester vos modèles déployés sans avoir à développer votre propre application cliente. Azure AI Studio propose plusieurs terrains de jeu avec différentes options de paramétrage.
Terrain de jeu d’achèvements
Le terrain de jeu d’achèvements vous permet d’effectuer des appels à vos modèles déployés par le biais d’une interface d’entrée de texte et de sortie de texte et d’ajuster les paramètres. Vous devez sélectionner le nom de déploiement de votre modèle sous Déploiements. Si vous le souhaitez, vous pouvez utiliser les exemples fournis pour commencer, puis entrer vos propres invites.
Paramètres du terrain de jeu d’achèvements
Il existe de nombreux paramètres que vous pouvez ajuster pour modifier les performances de votre modèle :
- Température : contrôle du caractère aléatoire. La réduction de la température signifie que le modèle produit des réponses plus répétitives et déterministes. L’augmentation de la température entraîne des réponses plus inattendues ou créatives. Essayez d’ajuster la température ou le Top P, mais pas les deux.
- Longueur maximale (jetons) : définissez une limite pour le nombre de jetons par réponse du modèle. L’API prend en charge un maximum de 4 000 jetons partagés entre l’invite (y compris le message système, les exemples, l’historique des messages et la requête utilisateur) et la réponse du modèle. Un jeton correspond à environ quatre caractères pour un texte typique en anglais.
- Séquences d’arrêt : faites en sorte que les réponses s’arrêtent à un point souhaité, tel que la fin d’une phrase ou d’une liste. Spécifiez jusqu’à quatre séquences où le modèle cessera de générer d’autres jetons dans une réponse. Le texte retourné ne contient pas la séquence d’arrêt.
- Premières probalités (P premières) : comme la température, cela permet de contrôler le caractère aléatoire, mais en utilisant une autre méthode. La réduction du Top P limite la sélection de jetons du modèle à des jetons plus probables. L’augmentation du Top P permet au modèle de choisir parmi des jetons avec des probabilités élevées et faibles. Essayez d’ajuster la température ou le Top P, mais pas les deux.
- Pénalité de fréquence : réduisez le risque de répéter un jeton proportionnellement en fonction de la fréquence à laquelle il est apparu dans le texte jusqu’à présent. Cela réduit la probabilité de répéter exactement le même texte dans une réponse.
- Pénalité de présence : réduisez le risque de répéter tout jeton qui est apparu dans le texte jusqu’à présent. Cela augmente la probabilité d’introduire de nouvelles rubriques dans une réponse.
- Texte de pré-réponse : insérer du texte après l’entrée de l’utilisateur et avant la réponse du modèle. Cela peut aider à préparer le modèle pour une réponse.
- Texte après réponse : insérez du texte après la réponse générée par le modèle pour encourager d’autres entrées de l’utilisateur, comme lors de la modélisation d’une conversation.
Terrain de jeu de conversation
Le terrain de jeu de conversation est basé sur une interface de conversation entrante et sortante. Vous pouvez initialiser la session avec un message système pour configurer le contexte de conversation.
Dans le terrain de jeu de conversation, vous pouvez ajouter des exemples à quelques captures. Le terme « few shot » fait référence à la fourniture de quelques exemples pour aider le modèle à apprendre ce qu’il doit faire. Vous pouvez y réfléchir contrairement à « zéro shot », qui fait référence à ne fournir aucun exemple.
Dans la configuration de l’Assistant, vous pouvez fournir quelques exemples de « few shot » de ce que peut être l’entrée utilisateur et la réponse de l’assistant. L’assistant tente d’imiter les réponses que vous incluez ici dans le ton, les règles et le format que vous avez définis dans votre message système.
Paramètres du terrain de jeu de conversation
Le terrain de jeu Conversation, comme le terrain de jeu Achèvements, inclut également des paramètres pour personnaliser le comportement du modèle. Le terrain de jeu Conversation prend également en charge d’autres paramètres non disponibles dans le terrain de jeu Complétions. Il s’agit notamment des paramètres suivants :
- Réponse maximale : définissez une limite pour le nombre de jetons par réponse du modèle. L’API prend en charge un maximum de 4 000 jetons partagés entre l’invite (y compris le message système, les exemples, l’historique des messages et la requête utilisateur) et la réponse du modèle. Un jeton correspond à environ quatre caractères pour un texte typique en anglais.
- Messages passés inclus : sélectionnez le nombre d’anciens messages à inclure dans chaque nouvelle requête d’API. L’inclusion des messages passés aide à donner du contexte au modèle pour les nouvelles requêtes utilisateur. La définition de ce nombre sur 10 inclut cinq requêtes utilisateur et cinq réponses système.
Le nombre de jetons actuels est affichable à partir du terrain de jeu de conversation. Étant donné que les appels d’API sont facturés par jeton et qu’il est possible de définir une limite maximale de jetons de réponse, vous devez garder un œil sur le nombre de jetons actuel pour vous assurer que la conversation entrante ne dépasse pas le nombre maximal de jetons de réponse.