Verstehen, wie Ihr Sprachmodell geerdet wird
Sprachmodelle zeichnen sich durch die Generierung ansprechender Texte aus und sind ideal als Basis für Copiloten. Copilots bieten Benutzerinnen und Benutzern eine intuitive, chatbasierte Anwendung, um Unterstützung bei ihrer Arbeit zu erhalten. Beim Erstellen eines Copilot für einen bestimmten Anwendungsfall sollten Sie sicherstellen, dass Ihr Sprachmodell geerdet ist und faktenbezogene Informationen verwendet, die für die Anforderungen des Benutzers relevant sind.
Obwohl Sprachmodelle auf eine große Menge an Daten trainiert werden, haben sie möglicherweise keinen Zugriff auf das Wissen, das Sie Ihren Benutzerinnen und Benutzern zur Verfügung stellen möchten. Um sicherzustellen, dass ein Copilot auf bestimmten Daten basiert, um genaue und domänenspezifische Antworten bereitzustellen, können Sie Retrieval Augmented Generation (RAG) verwenden.
Grundlagen von RAG
RAG ist eine Technik, die Sie zum erden eines Sprachmodells verwenden können. Anders ausgedrückt: Es handelt sich um einen Prozess zum Abrufen von Informationen, die für die ursprüngliche Eingabeaufforderung von der Benutzerin und dem Benutzer relevant sind. Im Allgemeinen beinhaltet das RAG-Muster die folgenden Schritte:
- Abrufen (retrieve) von Groundingdaten basierend auf dem ursprünglichen Benutzerprompt
- Erweitern der Eingabeaufforderung mit Grounding-Daten.
- Verwenden eines Sprachmodells, um eine fundierte Antwort zu generieren
Durch das Abrufen des Kontexts aus einer angegebenen Datenquelle stellen Sie sicher, dass das Sprachmodell relevante Informationen verwendet, wenn sie antworten, anstatt sich auf seine Trainingsdaten zu verlassen.
Die Verwendung von RAG ist eine leistungsstarke und benutzerfreundliche Technik für viele Fälle, in denen Sie Ihr Sprachmodell festigen und die sachliche Genauigkeit der Antworten ihres Copiloten verbessern möchten.
Hinzufügen von Groundingdaten zu einem Azure KI-Projekt
Sie können Azure KI Studio verwenden, um einen benutzerdefinierten Copilot zu erstellen, der Ihre eigenen Daten als Grundlage für Prompts verwendet. Azure KI Studio unterstützt eine breite Palette von Datenverbindungen, die Sie zum Hinzufügen von Daten zu einem Projekt verwenden können, einschließlich:
- Azure Blob Storage
- Azure Data Lake Storage Gen2
- Microsoft OneLake
Sie können Dateien oder Ordner auch in den Speicher hochladen, der von Ihrem KI Studio-Projekt verwendet wird.