Partager via


Incorporations dans .NET

Les LLM capturent la signification sémantique grâce aux incorporations. Elles sont des représentations numériques de données non numériques qu’un LLM peut utiliser pour déterminer les relations entre les concepts. Vous pouvez utiliser des incorporations pour aider un modèle IA à comprendre la signification des entrées afin qu’il puisse effectuer des comparaisons et des transformations, telles que la synthèse du texte ou la création d’images à partir de descriptions de texte. Les LLM peuvent utiliser des incorporations immédiatement, et vous pouvez stocker des incorporations dans des bases de données vectorielles pour fournir une mémoire sémantique pour les machines virtuelles en fonction des besoins.

Cas d’usage pour les incorporations

Cette section répertorie les principaux cas d’usage des incorporations.

Utiliser vos propres données pour améliorer la pertinence de l’achèvement

Utilisez vos propres bases de données pour générer des incorporations pour vos données et l’intégrer à un LLM pour le rendre disponible pour les achèvements. Cette utilisation des incorporations est un aspect important de la génération augmentée par récupération.

Augmenter la quantité de texte que vous pouvez insérer dans une invite

Utilisez des incorporations pour augmenter la quantité de contexte que vous pouvez ajuster à une invite sans augmenter le nombre de jetons requis.

Par exemple, supposons que vous souhaitiez inclure 500 pages de texte dans une invite. Le nombre de jetons pour ce texte brut dépasse la limite du jeton d’entrée, ce qui rend impossible d’inclure directement dans une invite. Vous pouvez utiliser des incorporations pour résumer et décomposer de grandes quantités de ce texte en morceaux suffisamment petits pour s’adapter à une entrée, puis évaluer la similarité de chaque morceau à l’intégralité du texte brut. Vous pouvez ensuite choisir un élément qui conserve le mieux la signification sémantique du texte brut et l’utiliser dans votre invite sans atteindre la limite de jetons.

Effectuer une classification de texte, une synthèse ou une traduction

Utilisez des incorporations pour aider un modèle à comprendre la signification et le contexte du texte, puis à classifier, résumer ou traduire ce texte. Par exemple, vous pouvez utiliser des incorporations pour aider les modèles à classer les textes comme positifs ou négatifs, courrier indésirable ou non, ou actualités ou opinions.

Générer et transcrire l’audio

Utilisez des incorporations audio pour traiter des fichiers audio ou des entrées dans votre application.

Par exemple, service Speech prend en charge une gamme d’incorporations audio, notamment la reconnaissance vocale et la synthèse vocale. Vous pouvez traiter l’audio en temps réel ou en lots.

Transformer du texte en images ou images en texte

Le traitement d’images sémantiques nécessite des incorporations d’images, que la plupart des LLM ne peuvent pas générer. Utilisez un modèle d’incorporation d’images tel que VIT pour créer des incorporations vectorielles pour les images. Vous pouvez ensuite utiliser ces incorporations avec un modèle de génération d’image pour créer ou modifier des images à l’aide de texte ou inversement. Par exemple, vous pouvez utiliser le modèle DALL·E pour générer des images telles que des logos, des visages, des animaux et des paysages.

Générer ou documenter du code

Utilisez des incorporations pour aider un modèle à créer du code à partir de texte ou inversement, en convertissant différents codes ou expressions de texte en représentation commune. Par exemple, vous pouvez utiliser des incorporations pour aider un modèle à générer ou à documenter du code en C# ou Python.

Choisir un modèle d’incorporation

Vous générez des incorporations pour vos données brutes à l’aide d’un modèle d’incorporation IA capable d’encoder un morceau de données non numériques dans un vecteur (un long tableau de nombres). Le modèle peut également décoder une incorporation dans des données non numériques qui ont la même signification ou similaire que les données brutes d’origine. Il existe de nombreux modèles d’incorporation disponibles pour vous permettre d’utiliser, avec le modèle text-embedding-ada-002 de OpenAI étant l’un des modèles courants utilisés. Pour plus d’exemples, consultez la liste des modèles d’incorporation disponibles sur Azure OpenAI.

Stocker et traiter des incorporations dans une base de données vectorielle

Après avoir généré des incorporations, vous aurez besoin d’un moyen de les stocker afin de pouvoir les récupérer ultérieurement avec des appels à un LLM. Les bases de données vectorielles sont conçues pour stocker et traiter des vecteurs, de sorte qu’elles constituent un foyer naturel pour les incorporations. Différentes bases de données vectorielles offrent différentes fonctionnalités de traitement. Vous devez donc en choisir une en fonction de vos données brutes et de vos objectifs. Pour plus d’informations sur vos options, consultez solutions de base de données vectorielles disponibles.

Utilisation d’incorporations dans votre solution LLM

Lors de la création d’applications basées sur LLM, vous pouvez utiliser le noyau sémantique pour intégrer des modèles et des magasins vectoriels, afin de pouvoir extraire rapidement des données texte et générer et stocker des incorporations. Cela vous permet d’utiliser une solution de base de données vectorielle pour stocker et récupérer des mémoires sémantiques.