部署生成式 AI 模型

已完成

首先需要部署模型来进行聊天或进行 API 调用来接收对提示的答复。 创建新部署时,需要指出要部署的基础模型。 只要每分钟标记数 (TPM) 保持在部署配额内,就可以在一个或多个 Azure OpenAI 资源中部署任意数量的部署。

使用 Azure AI Studio 进行部署

在 Azure AI Studio 的“部署”页中,可以通过从菜单中选择模型名称来创建新部署。 可用的基础模型来自模型页中的列表。

Azure AI Studio 门户的模型部署向导的屏幕截图。

在 Studio 的“部署”页中,还可以查看所有部署的相关信息,包括部署名称、模型名称、模型版本、状态、创建日期等。

使用 Azure CLI 进行部署

还可以使用控制台部署模型。 使用此示例,将以下变量替换为自己的资源值:

  • OAIResourceGroup:替换为资源组名称
  • MyOpenAIResource:替换为资源名称
  • MyModel:替换为模型的唯一名称
  • gpt-35-turbo:替换为要部署的基础模型
az cognitiveservices account deployment create \
   -g OAIResourceGroup \
   -n MyOpenAIResource \
   --deployment-name MyModel \
   --model-name gpt-35-turbo \
   --model-version "0301"  \
   --model-format OpenAI \
   --sku-name "Standard" \
   --sku-capacity 1

使用 REST API 进行部署

可以使用 REST API 部署模型。 在请求正文中,指定要部署的基础模型。 请参阅 Azure OpenAI 文档中的示例。