部署生成式 AI 模型
首先需要部署模型来进行聊天或进行 API 调用来接收对提示的答复。 创建新部署时,需要指出要部署的基础模型。 只要每分钟标记数 (TPM) 保持在部署配额内,就可以在一个或多个 Azure OpenAI 资源中部署任意数量的部署。
使用 Azure AI Studio 进行部署
在 Azure AI Studio 的“部署”页中,可以通过从菜单中选择模型名称来创建新部署。 可用的基础模型来自模型页中的列表。
在 Studio 的“部署”页中,还可以查看所有部署的相关信息,包括部署名称、模型名称、模型版本、状态、创建日期等。
使用 Azure CLI 进行部署
还可以使用控制台部署模型。 使用此示例,将以下变量替换为自己的资源值:
- OAIResourceGroup:替换为资源组名称
- MyOpenAIResource:替换为资源名称
- MyModel:替换为模型的唯一名称
- gpt-35-turbo:替换为要部署的基础模型
az cognitiveservices account deployment create \
-g OAIResourceGroup \
-n MyOpenAIResource \
--deployment-name MyModel \
--model-name gpt-35-turbo \
--model-version "0301" \
--model-format OpenAI \
--sku-name "Standard" \
--sku-capacity 1
使用 REST API 进行部署
可以使用 REST API 部署模型。 在请求正文中,指定要部署的基础模型。 请参阅 Azure OpenAI 文档中的示例。