Bereitstellen generativer KI-Modelle

Abgeschlossen

Sie müssen zunächst ein Modell bereitstellen, mit dem Sie chatten oder API-Aufrufe tätigen können, um Antworten auf Eingabeaufforderungen zu erhalten. Wenn Sie eine neue Bereitstellung erstellen, müssen Sie angeben, welches Basismodell bereitgestellt werden soll. Sie können eine beliebige Anzahl von Bereitstellungen in einer oder mehreren Azure OpenAI-Ressourcen bereitstellen, solange ihre Token pro Minute (TPM) innerhalb des Bereitstellungskontingents verbleiben.

Bereitstellen mit Azure KI Studio

Auf der Seite Bereitstellungen von Azure KI Studio können Sie eine neue Bereitstellung erstellen, indem Sie im Menü einen Modellnamen auswählen. Die verfügbaren Basismodelle stammen aus der Liste auf der Seite „Modelle“.

Screenshot des Assistenten für die Bereitstellung von Modellen im Azure KI Studio-Portal.

Auf der Seite Bereitstellungen in Studio können Sie auch Informationen zu allen Ihren Bereitstellungen einsehen, einschließlich Bereitstellungsname, Modellname, Modellversion, Status, Erstellungsdatum und mehr.

Bereitstellen über die Azure-Befehlszeilenschnittstelle

Sie können ein Modell auch mithilfe der Konsole bereitstellen. Ersetzen Sie in diesem Beispiel die folgenden Variablen durch Ihre eigenen Ressourcenwerte:

  • OAIResourceGroup: Ersetzen Sie diese Variable durch den Namen Ihrer Ressourcengruppe.
  • MyOpenAIResource: Ersetzen Sie diese Variable durch den Namen Ihrer Ressourcengruppe.
  • MyModel: Ersetzen Sie diese Variable durch einen eindeutigen Namen für Ihr Modell.
  • gpt-35-turbo: Ersetzen Sie diese Variable durch das Basismodell, das Sie bereitstellen möchten.
az cognitiveservices account deployment create \
   -g OAIResourceGroup \
   -n MyOpenAIResource \
   --deployment-name MyModel \
   --model-name gpt-35-turbo \
   --model-version "0301"  \
   --model-format OpenAI \
   --sku-name "Standard" \
   --sku-capacity 1

Bereitstellen mit der REST-API

Sie können ein Modell mithilfe der REST-API bereitstellen. Im Anforderungstext geben Sie das Basismodell an, das Sie bereitstellen möchten. Ein Beispiel finden Sie in der Azure OpenAI-Dokumentation.