Comprendre les invites pour améliorer la qualité de la saisie semi-automatique

5 minutes

La construction de l’invite peut être difficile. Dans la pratique, l’invite agit pour configurer les pondérations du modèle pour accomplir la tâche souhaitée. Il s’agit toutefois plus d’un art que d’une science, qui nécessite souvent de l’expérience et de l’intuition pour créer une invite réussie.

Quand vous envoyez des invites bien construites au modèle, celui-ci retourne de meilleurs achèvements.

Dans notre bot de recommandation de randonnées, une excellente invite système aide le modèle à se préparer à recommander les randonnées appropriées. De plus, les invites utiles de l’utilisateur affinent les recommandations que le modèle retourne.

Dans cette unité, nous abordons les concepts généraux et les modèles qui peuvent être utilisés pour construire des invites. Nous examinons également certaines techniques qui peuvent être utilisées pour améliorer la qualité des achèvements.

Concepts de base

Les invites de texte sont la façon dont les utilisateurs interagissent avec les modèles GPT. Les modèles de langage génératif essaient de produire la prochaine série de mots qui sont le plus susceptibles de suivre le texte précédent. C’est comme si nous disions Quelle est la première chose qui vous vient à l’esprit quand je dis <invite> ?

À mesure que vous développez des invites complexes, il est utile de garder ce comportement fondamental à l’esprit. Quelle que soit l’invite, le modèle répond simplement avec ce qu’il considère qui est le plus susceptible de suivre l’invite.

Composants d’invite

Lors de l’utilisation de l’API d’achèvement, il n’y a pas de différenciation entre les différentes parties de l’invite, mais il est toujours utile de disséquer l’invite en composants, car l’objectif est de penser à la construction de l’invite.

Instructions

Les instructions sont probablement le composant d’invite le plus couramment utilisé. Elles font partie de l’invite qui indique au modèle ce qu’il faut faire et peuvent aller du simple au complexe. Par exemple, Recommander des randonnées à Vous êtes un passionné de randonnée et aidez les gens à découvrir des randonnées amusantes dans leur région. Vous êtes optimiste et amical. Vous vous présentez quand vous dites bonjour pour la première fois. Quand vous aidez les gens, vous leur demandez toujours où ils se trouvent et l’intensité de la randonnée souhaitée pour formuler une recommandation.

Contenu principal

Le contenu principal désigne du texte traité ou transformé par le modèle. Il est généralement utilisé avec des instructions. Par exemple, Vous allez fournir trois suggestions de randonnées à proximité qui varient en longueur après avoir obtenu ces informations.

Le contenu principal peut être beaucoup plus long, comme demander au modèle de résumer un article Wikipédia.

Exemples

Les invites réussies s’appuient souvent sur la pratique de l’apprentissage « en un coup » ou « en quelques coups ». Ce principe fait référence à l’inclusion d’un ou de plusieurs exemples du comportement souhaité du modèle, généralement en incluant des paires d’entrée et de sortie. Il ne s’agit pas d’un apprentissage dans le sens où le modèle est modifié de façon permanente. En lieu et place, les exemples conditionnent le modèle à répondre comme souhaité uniquement pour l’inférence actuelle.

L’utilisation d’invites sans exemples est parfois appelée apprentissage « zéro coup ».

Hike request: I live near Seattle and would like an easy hike.
Recommendation: That's great to hear, the Seattle area has some of the best hikes in the nation! You should try Little Si, you'll love it.

Hike request: I want to go on a hike in the North Cascades that will blow my mind.
Recommendation: You won't find a bad hike in the North Cascades. However, I hear the Sahale Arm stops people in their tracks with its beauty.

Hike request: I'd like to find a strenuous hike that's just like the Enchantments, but without as many people.
Recommendation:

Signal

Les signaux servent de « coup d’envoi » pour la sortie du modèle, ce qui aide à diriger le modèle vers la sortie souhaitée. Il s’agit souvent d’un préfixe qui sert de base au modèle. Un signal peut diriger la saisie semi-automatique pour inclure des éléments clés, qui sont souvent utilisés avec des instructions.

L’exemple suivant montre un signal unique pour résumer de nombreux avis sur les sentiers.

Prompt	Completion
Les avis sur les sentiers est une considération importante pour déterminer si les randonneurs vont faire une randonnée, car un avis indique l’état actuel du sentier concerné. [...] Résumer les avis ci-dessus sur le sentier : Les principaux points à retenir des avis sur le sentier sont les suivants :	le sentier Mailbox Peak est boueux en ce moment et les moustiques sont féroces une fois que vous dépassez la limite forestière. Il y a aussi beaucoup de monde sur le sentier à partir du milieu de la matinée.

Contenu de support

Le contenu de support désigne les informations que le modèle peut utiliser pour influencer la sortie d’une manière ou d’une autre. Il diffère du contenu principal en ce qu’il ne s’agit pas de la cible principale de la tâche, mais qu’il est généralement utilisé avec le contenu principal. Les exemples courants incluent les informations contextuelles telles que la date du jour, le nom et les préférences de l’utilisateur, etc.

Bonnes pratiques

Être précis. Laissez le moins de place possible à l’interprétation. Limitez l’espace opérationnel.
Être descriptif. Utilisez des analogies.
Se répéter. Il peut arriver que vous deviez vous répéter pour le modèle. Fournissez des instructions avant et après votre contenu principal, utilisez une instruction et un signal, etc.
L’ordre est important. L’ordre dans lequel vous présentez les informations au modèle peut avoir un impact sur la sortie. L’endroit où vous placez les instructions, à savoir avant votre contenu (« Résumer les éléments suivants... ») ou après (« Résumer les éléments ci-dessus... »), peut faire varier la sortie. Même l’ordre des exemples en quelques coups peut avoir de l’importance. Cette technique est appelée « biais de récence ».
Préparer la sortie. Incluez quelques mots ou phrases à la fin de l’invite afin d’obtenir du modèle une réponse qui suit la forme souhaitée.
Donner au modèle une « porte de sortie ». Il peut parfois être utile de fournir au modèle un autre chemin s’il ne parvient pas à réaliser la tâche attribuée. Par exemple, quand vous posez une question sur un texte, vous pouvez inclure un élément tel que « répondre par “introuvable” si la réponse n’est pas présente ». Cette technique peut aider le modèle à éviter de générer de fausses réponses.
Invites en chaîne de pensée. Il est demandé au modèle de procéder pas à pas et de présenter toutes les étapes impliquées. Cela réduit le risque d’inexactitude des résultats et facilite l’évaluation de la réponse du modèle.