Grundlegendes zu Retrieval Augmented Generation (RAG) mit Azure OpenAI Service
RAG mit Azure OpenAI ermöglicht Entwicklern die Verwendung unterstützter KI-Chatmodelle, die auf bestimmte Informationsquellen verweisen können, um eine Grundlage für die Antwort vorzuweisen. Durch das Hinzufügen dieser Informationen kann das Modell sowohl auf die angegebenen Daten als auch auf das vorab antrainierte Wissen verweisen, um effektivere Antworten bereitzustellen.
Azure OpenAI ermöglicht RAG, indem vortrainierte Modelle mit Ihren eigenen Datenquellen verbunden werden. Azure OpenAI on your data nutzt die Suchfunktion der Azure KI-Suche, um die relevanten Datenblöcke zum Prompt hinzuzufügen. Sobald sich Ihre Daten in einem KI-Suche-Index befinden, führt Azure OpenAI on your data die folgenden Schritte aus:
- Empfangen der Benutzeraufforderung
- Bestimmen des relevanten Inhalts und der Absicht der Aufforderung
- Abfragen des Suchindexes mit diesem Inhalt und dieser Absicht
- Einfügen des Suchergebnisblocks in die Azure OpenAI-Aufforderung zusammen mit der Systemmeldung und der Benutzeraufforderung
- Senden der gesamten Aufforderung an Azure OpenAI
- Zurückgeben der Antwort und des Datenverweises (sofern vorhanden) an die Benutzer*innen
Azure OpenAI on your data unterstützt das Modell standardmäßig dabei, nur Ihre Daten für die Antwort zu verwenden, erfordert dies jedoch nicht. Beim Herstellen einer Verbindung mit Ihren Daten kann diese Einstellung deaktiviert sein, was dazu führen kann, dass das Modell das vorab antrainierte Wissen Ihren Daten vorzieht.
Feinabstimmung und RAG
Die Feinabstimmung ist eine Technik, die zum Erstellen eines benutzerdefinierten Modells verwendet wird, indem ein vorhandenes Basismodell wie gpt-35-turbo
mit einem Dataset mit zusätzlichen Trainingsdaten trainiert wird. Die Feinabstimmung kann zu hochwertigeren Anforderungen als nur mit Prompt Engineering führen, das Modell an Beispiele anpassen, deren Größe die Kapazität eines Prompts übersteigt, und es dem Benutzer ermöglichen, weniger Beispiele anzugeben, um die gleiche hochwertige Antwort zu erhalten. Der Prozess für die Feinabstimmung ist jedoch sowohl kostspielig als auch zeitaufwendig und sollte nur in Anwendungsfällen verwendet werden, in denen dies erforderlich ist.
RAG mit Azure OpenAI on your data verwendet weiterhin die zustandslose API, um eine Verbindung mit dem Modell herzustellen. Dadurch entfällt die Anforderung, ein benutzerdefiniertes Modell mit Ihren Daten zu trainieren, und die Interaktion mit dem KI-Modell wird vereinfacht. Die KI-Suche sucht zuerst nach den nützlichen Informationen, um den Prompt zu beantworten, fügt diese dem Prompt als Basisdaten hinzu und Azure OpenAI formuliert die Antwort basierend auf diesen Informationen.