Zugreifen auf Azure OpenAI Service

Abgeschlossen

Der erste Schritt beim Erstellen einer generativen KI-Lösung mit Azure OpenAI besteht darin, in Ihrem Azure-Abonnement eine Azure OpenAI-Ressource bereitzustellen. Sie können beginnen, indem Sie eine Ressource im Azure-Portal oder mit der Azure-Befehlszeilenschnittstelle (CLI) erstellen.

Erstellen einer Azure OpenAI Service-Ressource im Azure-Portal

Wenn Sie eine Azure OpenAI Service-Ressource erstellen, müssen Sie einen Abonnement- und Ressourcengruppennamen, eine Region und einen eindeutigen Instanznamen angeben sowie einen Tarif auswählen.

Screenshot der Seite im Azure-Portal zum Erstellen einer Azure OpenAI Service-Ressource.

Erstellen einer Azure OpenAI Service-Ressource mithilfe der Azure CLI

Um eine Azure OpenAI Service-Ressource über die CLI zu erstellen, greifen Sie auf dieses Beispiel zurück, und ersetzen Sie die folgenden Variablen durch Ihre eigenen:

  • MyOpenAIResource: Ersetzen Sie diese Variable durch einen eindeutigen Namen für Ihre Ressourcengruppe.
  • OAIResourceGroup: Ersetzen Sie diese Variable durch den Namen Ihrer Ressourcengruppe.
  • eastus: Ersetzen Sie diese Variable durch die Region, in der Ihre Ressource bereitgestellt werden soll.
  • subscriptionID: Ersetzen Sie diese Variable durch Ihre Abonnement-ID.
az cognitiveservices account create \
-n MyOpenAIResource \
-g OAIResourceGroup \
-l eastus \
--kind OpenAI \
--sku s0 \
--subscription subscriptionID

Hinweis

Die für einen Dienst verfügbaren Regionen finden Sie über den CLI-Befehl az account list-locations. Informationen zum Anmelden bei Azure und Erstellen einer Azure-Gruppe über die CLI finden Sie in dieser Dokumentation. Azure OpenAI Service bietet Zugriff auf viele Arten von Modellen. Bestimmte Modelle sind nur in ausgewählten Regionen verfügbar. Informationen zur regionalen Verfügbarkeit finden Sie im Leitfaden zur Modellverfügbarkeit für Azure OpenAI. Sie können zwei Azure OpenAI-Ressourcen pro Region erstellen.

Verwenden von Azure OpenAI Foundry

Azure AI Foundry bietet Zugriff auf Modellverwaltungs-, Bereitstellungs-, Experimentier-, Anpassungs- und Lernressourcen.

Sie können über das Azure-Portal auf Azure AI Foundry zugreifen, nachdem Sie eine Ressource erstellt haben, oder unter https://ai.azure.com/, indem Sie sich bei Ihrem Azure-Konto anmelden. Wählen Sie während des Anmeldeworkflows das passende Verzeichnis, Azure-Abonnement und die Azure OpenAI-Ressource aus.

Wenn Sie Azure AI Foundry zum ersten Mal öffnen, sollten Sie zur Seite Azure OpenAI navigieren (die speziell Ihre Azure OpenAI Service-Modelle enthält), Ihre Ressource auswählen, sofern dies noch nicht geschehen, und Ihr erstes Modell bereitstellen. Wählen Sie dazu die Seite Bereitstellungen aus, von der aus Sie ein Basismodell bereitstellen und damit experimentieren können.

Hinweis

Wenn Sie nicht der Ressourcenbesitzer sind, benötigen Sie die folgenden rollenbasierten Zugriffssteuerungen: 1. Cognitive Services OpenAI-Benutzer: Diese Rolle ermöglicht das Anzeigen von Ressourcen und die Verwendung des Chat-Playgrounds. 2. Cognitive Services OpenAI-Mitwirkender: Mit dieser Rolle kann der Benutzer neue Bereitstellungen erstellen.

Screenshot des Seitenmenüs im Azure AI Foundry-Portal

Typen von OpenAI-Modellen

Zum Aufnehmen der Arbeit mit Azure OpenAI müssen Sie ein Basismodell auswählen und bereitstellen. Microsoft bietet Basismodelle und die Möglichkeit, angepasste Basismodelle zu erstellen. In dieser Lektion werden die derzeit verfügbaren Basismodelle erläutert.

Azure OpenAI umfasst mehrere Modelltypen:

  • GPT-4-Modelle sind die neueste Generation von GPT-Modellen (Generative Pretrained), die natürliche Sprache und Codevervollständigungen basierend auf Eingabeaufforderungen in natürlicher Sprache generieren können.
  • GPT 3.5-Modelle können natürliche Sprache und Codevervollständigungen basierend auf Eingabeaufforderungen in natürlicher Sprache generieren. Insbesondere GPT-35-turbo-Modelle sind für chatbasierte Interaktionen optimiert und funktionieren gut in den meisten generativen KI-Szenarios.
  • Einbettungsmodelle konvertieren Text in numerische Vektoren und sind in Sprachanalyseszenarios nützlich (z. B. beim Vergleichen von Textquellen auf Ähnlichkeiten).
  • DALL-E-Modelle werden zum Generieren von Bildern basierend auf Eingabeaufforderungen in natürlicher Sprache verwendet. Derzeit befinden sich DALL-E-Modelle in der Vorschauphase.
  • Flüstermodelle werden verwendet, um Sprache in Text zu konvertieren.
  • Text-zu-Sprache-Modelle werden verwendet, um Text in Sprache zu konvertieren.

Hinweis

Preise werden anhand von Tokens und Modelltypen festgelegt. Weitere Informationen zu den aktuellen Preisen finden Sie hier.

Im Azure AI Foundry-Portal werden auf der Seite Modellkatalog die verfügbaren Basismodelle aufgelistet. Außerdem ist eine Option verfügbar, um zusätzliche angepasste Modelle durch Optimierung der Basismodelle zu erstellen. Die Modelle mit dem Status Succeeded wurden erfolgreich trainiert und können für die Bereitstellung ausgewählt werden.

Sie werden feststellen, dass es verschiedene Modelle gibt, die über OpenAI hinaus im Modellkatalog verfügbar sind, darunter Modelle von Microsoft, Meta, Mistral und mehr. Mit Azure AI Foundry können Sie eines dieser Modelle für Ihren Anwendungsfall bereitstellen. Dieses Modul konzentriert sich auf Azure OpenAI-Modelle.

Screenshot der sofort einsatzbereiten generativen KI-Modelle im Azure AI Foundry-Portal.

Bereitstellen von OpenAI-Modellen

Sie müssen zunächst ein Modell bereitstellen, mit dem Sie chatten oder API-Aufrufe tätigen können, um Antworten auf Eingabeaufforderungen zu erhalten. Wenn Sie eine neue Bereitstellung erstellen, müssen Sie angeben, welches Basismodell bereitgestellt werden soll. Sie können eine beliebige Anzahl von Bereitstellungen bereitstellen, solange ihre Token pro Minute (TPM) innerhalb des Bereitstellungskontingents liegen.

Bereitstellen mit Azure AI Foundry

Auf der Seite Modellkatalog im Azure AI Foundry-Portal können Sie eine neue Bereitstellung erstellen, indem Sie in der Liste einen Modellnamen auswählen.

Bereitstellen über die Azure-Befehlszeilenschnittstelle

Sie können ein Modell auch mithilfe der Konsole bereitstellen. Ersetzen Sie in diesem Beispiel die folgenden Variablen durch Ihre eigenen Ressourcenwerte:

  • OAIResourceGroup: Ersetzen Sie diese Variable durch den Namen Ihrer Ressourcengruppe.
  • MyOpenAIResource: Ersetzen Sie diese Variable durch den Namen Ihrer Ressourcengruppe.
  • MyModel: Ersetzen Sie diese Variable durch einen eindeutigen Namen für Ihr Modell.
  • gpt-35-turbo: Ersetzen Sie diese Variable durch das Basismodell, das Sie bereitstellen möchten.
az cognitiveservices account deployment create \
   -g OAIResourceGroup \
   -n MyOpenAIResource \
   --deployment-name MyModel \
   --model-name gpt-35-turbo \
   --model-version "0125"  \
   --model-format OpenAI \
   --sku-name "Standard" \
   --sku-capacity 1

Bereitstellen mit der REST-API

Sie können ein Modell mithilfe der REST-API bereitstellen. Im Anforderungstext geben Sie das Basismodell an, das Sie bereitstellen möchten. Ein Beispiel finden Sie in der Azure OpenAI-Dokumentation.

Erkunden von OpenAI-Prompts

Sobald das Modell bereitgestellt ist, können Sie testen, wie es Eingabeaufforderungen vervollständigt. Eine Eingabeaufforderung ist der Textteil einer Anforderung, der an den Vervollständigungsendpunkt des bereitgestellten Modells gesendet wird. Antworten werden als Vervollständigungen bezeichnet, die in Form von Text, Code oder anderen Formaten vorliegen können.

Eingabeaufforderungstypen

Eingabeaufforderungen können basierend auf der Aufgabe in Anforderungstypen gruppiert werden.

Aufgabentyp Beispiel für Eingabeaufforderung Beispiel für Vervollständigung
Klassifizieren von Inhalten Tweet: Mir hat die Reise gefallen.
Stimmung:
Positiv
Generieren neuer Inhalte Auflisten von Reisemöglichkeiten 1. Fahrrad
2. Auto ...
Führen einer Unterhaltung Ein freundlicher KI-Assistent Beispiele anzeigen
Transformation (Übersetzung und Symbolkonvertierung) Englisch Hallo
Deutsch:
Hallo
Zusammenfassen von Inhalten Bereitstellen einer Zusammenfassung des Inhalts
{text}
Im Inhalt werden Methoden für maschinelles Lernen genannt.
Weitermachen, wo Sie aufgehört haben Eine Möglichkeit zum Anbau von Tomaten ist das Einpflanzen von Saatgut.
Geben sachlicher Antworten Wie viele Monde hat die Erde? Eine

Qualität der Vervollständigung

Mehrere Faktoren beeinflussen die Qualität von Vervollständigungen einer generativen KI-Lösung.

  • Die Art und Weise, wie eine Eingabeaufforderung gestaltet ist. Erfahren Sie in der Lektion Prompt Engineering weiter unten in diesem Modul mehr über das Prompt Engineering.
  • Die Modellparameter (werden unten behandelt).
  • Die Daten, mit denen das Modell trainiert wird und die durch Modelloptimierung mit benutzerdefinierten Einstellungen angepasst werden können.

Sie haben mehr Kontrolle über die Vervollständigungen, die durch Trainieren eines benutzerdefinierten Modells zurückgegeben werden, als durch Prompt Engineering und Parameteranpassung.

Durchführen von API-Aufrufen

Sie können damit beginnen, Aufrufe an Ihr bereitgestelltes Modell über die REST-API, Python oder C# vorzunehmen. Wenn Ihr bereitgestelltes Modell auf einem GPT-3.5- oder GPT-4-Modell basiert, verwenden Sie die Dokumentation zu Chatvervollständigungen, die Endpunkte und Variablen enthält, die für diese Basismodelle erforderlich sind.

Verwenden der Azure Studio-Playgrounds

Playgrounds sind nützliche Oberflächen in Azure AI Foundry, auf denen Sie mit Ihren bereitgestellten Modellen experimentieren können, ohne eine eigene Clientanwendung entwickeln zu müssen. Das Azure AI Foundry-Portal bietet mehrere Playgrounds mit verschiedenen Optionen zur Parameteroptimierung.

Playground für Chats

Der Playground für Chats basiert auf einer Oberfläche zur Eingabe von Unterhaltungen und Ausgabe von Nachrichten. Sie können die Sitzung mit einer Systemnachricht initialisieren, um den Chatkontext einzurichten.

Im Chat-Playground können Sie Promptbeispiele verwenden, Parameter anpassen und Beispiele mit wenigen Stichproben hinzufügen. Der Begriff „Few-Shot“ bezieht sich auf die Bereitstellung einiger Beispiele, die dem Modell helfen zu lernen, was es tun muss. Sie können es sich als Gegensatz zu „Zero-Shot“ vorstellen, was bedeutet, das keine Beispiele bereitgestellt werden.

Screenshot des Chat-Playgrounds im Azure AI Foundry-Portal