你当前正在访问 Microsoft Azure Global Edition 技术文档网站。 如果需要访问由世纪互联运营的 Microsoft Azure 中国技术文档网站,请访问 https://docs.azure.cn。
概述:在 Azure AI Studio 中部署 AI 模型
Azure AI Studio 中的模型目录是用于发现和使用各种模型的中心,这些模型可用于构建生成式 AI 应用程序。 需要部署模型以使其可用于接收推理请求。 与已部署的模型交互的过程称为推理。 Azure AI Studio 根据你的需求和模型要求为这些模型提供了一套全面的部署选项。
部署模型
部署选项因模型类型而异:
- Azure OpenAI 模型:具有 Azure 提供的企业功能的最新 OpenAI 模型。
- 模型即服务模型:这些模型不需要订阅中的计算配额。 使用此选项,你可以部署模型即服务 (MaaS)。 你将使用无服务器 API 部署,并按令牌以即用即付方式付费。
- 开放和自定义模型:模型目录提供了对各种跨开放访问模式的模型的访问。 你可以在自己的订阅中托管开放式模型,并使用托管基础结构、虚拟机和实例数量进行容量管理。 Azure OpenAI、Hugging Face 和 NVIDIA 提供了多种模型。
Azure AI Studio 提供四种不同的部署选项:
名称 | Azure OpenAI 服务 | Azure AI 模型推理服务 | 无服务器 API | 托管计算 |
---|---|---|---|---|
可以部署哪些模型? | Azure OpenAI 模型 | Azure OpenAI 模型和模型即服务 | 模型即服务 | 开放和自定义模型 |
部署资源 | Azure OpenAI 资源 | Azure AI 服务资源 | AI 项目资源 | AI 项目资源 |
最适用于以下情况: | 你计划仅使用 OpenAI 模型 | 你计划利用包括 OpenAI 在内的 Azure AI 目录中的旗舰模型。 | 你计划从特定提供程序(不包括 OpenAI)使用单个模型。 | 如果你计划使用开放模型,并且订阅中有足够的计算配额。 |
计费依据 | 令牌使用情况和 PTU | 令牌使用情况 | 令牌使用情况1 | 计算核心小时数2 |
部署说明 | 部署到 Azure OpenAI 服务 | 部署到 Azure AI 模型推理 | 部署到无服务器 API | 部署到托管计算 |
1 最小终结点基础结构按分钟计费。 你无需为托管即用即付模型的基础结构付费。 删除终结点后,不会继续产生费用。
2 按分钟计费,具体取决于产品层以及自创建以来部署中使用的实例数量。 删除终结点后,不会继续产生费用。
提示
若要详细了解如何跟踪成本,请参阅监视通过 Azure 市场提供的模型的成本。
如何考虑部署选项?
Azure AI Studio 鼓励客户探索部署选项并选取最适合其业务和技术需求的选项。 一般来说,你可以采用以下思考过程:
从范围更广的部署选项开始。 这样就可以在应用程序中更快地进行迭代和原型设计,而无需在每次决定更改某些内容时重建体系结构。 Azure AI 模型推理服务是一个部署目标,它支持 Azure AI 目录中的所有旗舰模型,包括 Azure OpenAI 中的最新创新。
想要使用特定模型时:
如果你对 Azure OpenAI 模型感兴趣,可使用 Azure OpenAI 服务,该服务提供各种适合它们的功能,是专为它们设计的。
如果你对模型即服务中的特定模型感兴趣,不希望使用任何其他类型的模型,请使用无服务器 API 终结点。 它们允许在一组唯一的终结点 URL 和密钥下部署单个模型。
如果模型在模型即服务中不可用,并且订阅中有可用的计算配额,请使用支持部署开放和自定义模型的托管计算。 它还允许对部署推理服务器、协议和详细配置进行高级别的自定义。
提示
每个部署选项可能在网络、安全性以及内容安全之类的附加功能方面提供不同的功能。 请查看相应的文档以了解它们的局限性。