Wdrażanie modeli generacyjnych sztucznej inteligencji
Najpierw należy wdrożyć model na czacie lub wykonywać wywołania interfejsu API w celu odbierania odpowiedzi na monity. Podczas tworzenia nowego wdrożenia należy wskazać, który model podstawowy ma zostać wdrożony. Można wdrożyć dowolną liczbę wdrożeń w jednym lub wielu zasobach usługi Azure OpenAI, o ile ich tokeny na minutę (TPM) pozostają w ramach limitu przydziału wdrożenia.
Wdrażanie przy użyciu programu Azure AI Studio
Na stronie Wdrożenia usługi Azure AI Studio możesz utworzyć nowe wdrożenie, wybierając nazwę modelu z menu. Dostępne modele podstawowe pochodzą z listy na stronie modeli.
Na stronie Wdrożenia w programie Studio można również wyświetlić informacje o wszystkich wdrożeniach, w tym nazwę wdrożenia, nazwę modelu, wersję modelu, stan, datę utworzenia i nie tylko.
Wdrażanie przy użyciu interfejsu wiersza polecenia platformy Azure
Model można również wdrożyć przy użyciu konsoli programu . W tym przykładzie zastąp następujące zmienne własnymi wartościami zasobów:
- OAIResourceGroup: zastąp ciąg nazwą grupy zasobów
- MyOpenAIResource: zastąp ciąg nazwą zasobu
- MyModel: zastąp element unikatową nazwą modelu
- gpt-35-turbo: zastąp modelem bazowym, który chcesz wdrożyć
az cognitiveservices account deployment create \
-g OAIResourceGroup \
-n MyOpenAIResource \
--deployment-name MyModel \
--model-name gpt-35-turbo \
--model-version "0301" \
--model-format OpenAI \
--sku-name "Standard" \
--sku-capacity 1
Wdrażanie przy użyciu interfejsu API REST
Model można wdrożyć przy użyciu interfejsu API REST. W treści żądania należy określić model podstawowy, który chcesz wdrożyć. Zobacz przykład w dokumentacji usługi Azure OpenAI.