Comprendre l’ingénierie d’invite

Effectué

La qualité des invites que nous envoyons à un modèle IA, tel que celui disponible dans Azure OpenAI, influence directement la qualité de la réponse. Si vous concevez soigneusement les invites envoyées au modèle, le modèle peut fournir des réponses de meilleure qualité et plus intéressantes.

Qu’est-ce que l’ingénierie d’invite

L’ingénierie des invites est le processus de conception et d’optimisation des invites afin de mieux utiliser les modèles IA. La conception d’invites efficaces est essentielle à la réussite de l’ingénierie d’invite. Elle permet d’améliorer considérablement les performances du modèle IA pour des tâches spécifiques. Avec des invites pertinentes, spécifiques, univoques et bien structurées, le modèle peut mieux comprendre le contexte et générer des réponses plus précises.

Si nous souhaitons par exemple qu’un modèle OpenAI génère des descriptions de produit, nous pouvons lui fournir une description détaillée des fonctionnalités et avantages du produit. En fournissant ce contexte, le modèle est en mesure de générer des descriptions de produits plus précises et plus pertinentes.

L’ingénierie d’invite permet également d’atténuer les préjugés et d’améliorer l’impartialité des modèles d’IA. En concevant des invites diverses et inclusives, nous pouvons nous assurer que le modèle n’est pas partial par rapport à un groupe ou à une perspective particulière.

Important

Quelle que soit la qualité d’une invite conçue, les réponses des modèles d’IA ne doivent jamais être considérées comme des faits ou comme étant complètement exemptes de préjugés. Utilisez toujours l’IA de manière responsable. Pour plus d’informations, consultez la note de transparence de Microsoft sur Azure OpenAI et les principes d’IA de Microsoft.

En outre, l’ingénierie d’invite permet de comprendre les références que le modèle utilise pour générer la réponse. Les modèles d’IA générative contiennent de nombreux paramètres et la logique qu’ils suivent est en grande partie inconnue des utilisateurs. Il peut donc s’avérer difficile de comprendre comment la réponse donnée a été générée. En concevant des invites qui sont faciles à comprendre et à interpréter, nous pouvons aider les êtres humains à mieux comprendre de quelle façon le modèle génère ses réponses. Cela peut être particulièrement important dans des domaines comme la santé, quand il est essentiel de comprendre de quelle façon le modèle prend des décisions.

Différentes méthodes peuvent être utilisées pour l’ingénierie de vos propres invites, dont la plupart sont couvertes dans les prochaines leçons de ce module. Il s’agit notamment de fournir des instructions, un contenu contextuel, des indices ou des exemples few shot, et de classer correctement le contenu dans votre invite. Les méthodes décrites ici ne sont pas exhaustives, car il s’agit d’un domaine subtil et changeant.

Considérations relatives aux points de terminaison d’API

Les exemples présentés dans le reste de ce module sont axés sur ChatCompletion. Il est important de noter que ChatCompletion peut également être utilisé pour les scénarios autres que les conversations, avec des instructions incluses dans le message système et le contenu utilisateur fourni dans le message de rôle utilisateur. Si vous le souhaitez, la plupart de ces exemples peuvent être modifiés pour utiliser le point de terminaison Completion.

En termes de disponibilité du modèle, le point de terminaison Completion peut être utilisé avec les modèles gpt-3 et antérieures, et ChatCompletion peut être utilisé avec les modèles gpt-35-turbo et ultérieurs.

Ajustement des paramètres du modèle

En plus des techniques abordées dans ce module, l’ajustement des paramètres du modèle peut affecter la réponse de manière significative. Les paramètres temperature et top_p (top_probability) en particulier sont les plus susceptibles d’affecter la réponse d’un modèle, car ils contrôlent tous deux le caractère aléatoire dans le modèle, mais de manières différentes.

Des valeurs plus élevées produisent des réponses plus créatives et aléatoires, mais probablement moins cohérentes ou ciblées. Les réponses censées être fictives ou uniques sont meilleures quand ces paramètres sont définis sur des valeurs plus élevées. En revanche, un contenu devant être plus cohérent et concret doit utiliser des valeurs moins élevées.

Essayez d’ajuster ces paramètres avec la même invite pour déterminer comment les différentes valeurs affectent la réponse. Il est recommandé de modifier soit temperature, soit top_p, mais pas les deux valeurs simultanément.