Comprendre comment ancrer votre modèle de langage

Effectué

Les modèles de langage excellent dans la génération de texte attrayant, et sont idéaux comme base pour les copilotes. Les copilotes fournissent aux utilisateurs une application intuitive basée sur la conversation pour recevoir de l’aide dans le cadre de leur travail. Lors de la conception d’un copilote pour un cas d’usage spécifique, vous souhaitez vous assurer que votre modèle de langage est ancré sur, et utilise, des informations factuelles pertinentes pour ce dont l’utilisateur a besoin.

Bien que les modèles de langage soient entraînés sur une grande quantité de données, ils n’ont peut-être pas accès aux connaissances que vous souhaitez mettre à la disposition de vos utilisateurs. Pour être certain qu’un copilote soit ancré sur des données spécifiques pour fournir des réponses justes et propres au domaine, vous pouvez utiliser la génération augmentée de récupération (RAG).

Présentation de RAG

RAG est une technique que vous pouvez adopter pour ancrer un modèle de langage. En d’autres termes, il s’agit d’un processus de récupération d’informations pertinentes pour la le prompt initial de l’utilisateur. En général, le modèle RAG intègre les étapes suivantes :

Diagramme du modèle de génération augmentée de récupération.

  1. Récupérer les données de base en fonction du prompt initiale entré par l’utilisateur.
  2. Augmenter le prompt avec des données de base.
  3. Utilisez un modèle de langage pour générer une réponse fondée.

En récupérant le contexte à partir d’une source de données spécifiée, vous garantissez que le modèle de langage utilise des informations pertinentes lors de sa réponse, au lieu de se reposer sur ses données d’entraînement.

L’utilisation de RAG est une technique puissante et facile à utiliser pour de nombreux cas dans lesquels vous souhaitez ancrer votre modèle de langage et améliorer la justesse factuelle des réponses de votre copilote.

Ajout de données de base à un projet Azure AI

Vous pouvez utiliser Azure AI Studio pour créer un copilote personnalisé qui utilise vos propres données pour mettre au sol des invites. Azure AI Studio prend en charge une gamme de connexions de données que vous pouvez utiliser pour ajouter des données à un projet, notamment :

  • Stockage Blob Azure
  • Azure Data Lake Storage Gen2
  • Microsoft OneLake

Vous pouvez également charger des fichiers ou des dossiers dans le stockage utilisé par votre projet AI Studio.

Capture d’écran du dialogue ajout de données dans Azure AI Studio.