部署生成式 AI 模型

2 分钟

首先需要部署模型来进行聊天或进行 API 调用来接收对提示的答复。创建新部署时，需要指出要部署的基础模型。只要每分钟标记数 (TPM) 保持在部署配额内，就可以在一个或多个 Azure OpenAI 资源中部署任意数量的部署。

使用 Azure AI Studio 进行部署

在 Azure AI Studio 的“部署”页中，可以通过从菜单中选择模型名称来创建新部署。可用的基础模型来自模型页中的列表。

Azure AI Studio 门户的模型部署向导的屏幕截图。

在 Studio 的“部署”页中，还可以查看所有部署的相关信息，包括部署名称、模型名称、模型版本、状态、创建日期等。

使用 Azure CLI 进行部署

还可以使用控制台部署模型。使用此示例，将以下变量替换为自己的资源值：

OAIResourceGroup：替换为资源组名称
MyOpenAIResource：替换为资源名称
MyModel：替换为模型的唯一名称
gpt-35-turbo：替换为要部署的基础模型

az cognitiveservices account deployment create \
   -g OAIResourceGroup \
   -n MyOpenAIResource \
   --deployment-name MyModel \
   --model-name gpt-35-turbo \
   --model-version "0301"  \
   --model-format OpenAI \
   --sku-name "Standard" \
   --sku-capacity 1

使用 REST API 进行部署

可以使用 REST API 部署模型。在请求正文中，指定要部署的基础模型。请参阅 Azure OpenAI 文档中的示例。