Wdrażanie modeli generacyjnych sztucznej inteligencji

Ukończone

Najpierw należy wdrożyć model na czacie lub wykonywać wywołania interfejsu API w celu odbierania odpowiedzi na monity. Podczas tworzenia nowego wdrożenia należy wskazać, który model podstawowy ma zostać wdrożony. Można wdrożyć dowolną liczbę wdrożeń w jednym lub wielu zasobach usługi Azure OpenAI, o ile ich tokeny na minutę (TPM) pozostają w ramach limitu przydziału wdrożenia.

Wdrażanie przy użyciu programu Azure AI Studio

Na stronie Wdrożenia usługi Azure AI Studio możesz utworzyć nowe wdrożenie, wybierając nazwę modelu z menu. Dostępne modele podstawowe pochodzą z listy na stronie modeli.

Zrzut ekranu przedstawiający kreatora wdrażania modelu w portalu azure AI Studio.

Na stronie Wdrożenia w programie Studio można również wyświetlić informacje o wszystkich wdrożeniach, w tym nazwę wdrożenia, nazwę modelu, wersję modelu, stan, datę utworzenia i nie tylko.

Wdrażanie przy użyciu interfejsu wiersza polecenia platformy Azure

Model można również wdrożyć przy użyciu konsoli programu . W tym przykładzie zastąp następujące zmienne własnymi wartościami zasobów:

  • OAIResourceGroup: zastąp ciąg nazwą grupy zasobów
  • MyOpenAIResource: zastąp ciąg nazwą zasobu
  • MyModel: zastąp element unikatową nazwą modelu
  • gpt-35-turbo: zastąp modelem bazowym, który chcesz wdrożyć
az cognitiveservices account deployment create \
   -g OAIResourceGroup \
   -n MyOpenAIResource \
   --deployment-name MyModel \
   --model-name gpt-35-turbo \
   --model-version "0301"  \
   --model-format OpenAI \
   --sku-name "Standard" \
   --sku-capacity 1

Wdrażanie przy użyciu interfejsu API REST

Model można wdrożyć przy użyciu interfejsu API REST. W treści żądania należy określić model podstawowy, który chcesz wdrożyć. Zobacz przykład w dokumentacji usługi Azure OpenAI.