Comprendre la génération augmentée de récupération (RAG) avec Azure OpenAI Service

Effectué

RAG avec Azure OpenAI permet aux développeurs d’utiliser des modèles de conversation IA pris en charge qui peuvent référencer des sources d’informations spécifiques pour fonder la réponse. L’ajout de ces informations permet au modèle de référencer à la fois les données spécifiques fournies et ses connaissances préentraînées pour fournir des réponses plus efficaces.

Azure OpenAI active RAG en connectant des modèles préentraînés à vos propres sources de données. Azure OpenAI sur vos données utilise la fonctionnalité de recherche du service Recherche Azure AI pour ajouter les blocs de données appropriés au prompt. Une fois que vos données sont dans un index Recherche AI, Azure OpenAI sur vos données effectue les étapes suivantes :

  1. Recevoir le prompt de l’utilisateur.
  2. Déterminer le contenu et l’intention appropriés du prompt.
  3. Interroger l’index de recherche avec ce contenu et cette intention.
  4. Insérer un bloc de résultats de recherche dans le prompt Azure OpenAI, ainsi que le message système et le prompt de l’utilisateur.
  5. Envoyer le prompt entier à Azure OpenAI.
  6. Retourner la réponse et la référence des données (le cas échéant) à l’utilisateur.

Par défaut, Azure OpenAI sur vos données encourage, mais n’oblige pas, le modèle à répondre uniquement en utilisant vos données. Ce paramètre peut être désélectionné lors de la connexion de vos données. Si tel est le cas, le modèle peut préférer utiliser ses connaissances préentraînées plutôt que vos données.

Ajustement ou RAG

L’ajustement (ou « fine-tuning ») est une technique utilisée pour créer un modèle personnalisé en entraînant un modèle de base existant, par exemple gpt-35-turbo avec un jeu de données contenant des données d’entraînement supplémentaires. Avec l’ajustement, les demandes peuvent être de meilleure qualité que le prompt engineering seul, le modèle peut être personnalisé sur des exemples plus grands que ce que peut contenir un prompt et l’utilisateur peut fournir moins d’exemples pour obtenir la même réponse de haute qualité. Toutefois, le processus d’ajustement est à la fois coûteux et fastidieux, et ne doit être utilisé que pour les cas d’usage où il s’avère nécessaire.

RAG avec Azure OpenAI sur vos données utilise toujours l’API sans état pour se connecter au modèle, ce qui évite de devoir entraîner un modèle personnalisé avec vos données et simplifie l’interaction avec le modèle IA. Le service Recherche AI trouve d’abord les informations utiles pour répondre au prompt, les ajoute au prompt comme données de base, puis Azure OpenAI forme la réponse en fonction de ces informations.