你当前正在访问 Microsoft Azure Global Edition 技术文档网站。如果需要访问由世纪互联运营的 Microsoft Azure 中国技术文档网站，请访问 https://docs.azure.cn。

概述：在 Azure AI Foundry 门户中部署 AI 模型

Azure AI Foundry 门户中的模型目录是用于发现和使用各种模型的中心，这些模型可用于构建生成式 AI 应用程序。需要部署模型以使其可用于接收推理请求。与已部署的模型交互的过程称为推理。 Azure AI Foundry 根据你的需求和模型要求为这些模型提供了一套全面的部署选项。

部署模型

部署选项因模型类型而异：

Azure OpenAI 模型：具有 Azure 提供的企业功能的最新 OpenAI 模型。
模型即服务模型：这些模型不需要订阅中的计算配额。使用此选项，你可以部署模型即服务 (MaaS)。你将使用无服务器 API 部署，并按令牌以即用即付方式付费。
开放和自定义模型：模型目录提供了对各种跨开放访问模式的模型的访问。你可以在自己的订阅中托管开放式模型，并使用托管基础结构、虚拟机和实例数量进行容量管理。 Azure OpenAI、Hugging Face 和 NVIDIA 提供了多种模型。

Azure AI Foundry 提供四种不同的部署选项：

名称	Azure OpenAI 服务	Azure AI 模型推理	无服务器 API	托管计算
可以部署哪些模型？	Azure OpenAI 模型	Azure OpenAI 模型和模型即服务	模型即服务	开放和自定义模型
部署资源	Azure OpenAI 资源	Azure AI 服务资源	AI 项目资源	AI 项目资源
最适用于以下情况：	你计划仅使用 OpenAI 模型	你计划利用包括 OpenAI 在内的 Azure AI 目录中的旗舰模型。	你计划从特定提供程序（不包括 OpenAI）使用单个模型。	如果你计划使用开放模型，并且订阅中有足够的计算配额。
计费依据	令牌使用情况和 PTU	令牌使用情况	令牌使用情况¹	计算核心小时数²
部署说明	部署到 Azure OpenAI 服务	部署到 Azure AI 模型推理	部署到无服务器 API	部署到托管计算

¹ 最小终结点基础结构按分钟计费。你无需为托管即用即付模型的基础结构付费。删除终结点后，不会继续产生费用。

² 按分钟计费，具体取决于产品层以及自创建以来部署中使用的实例数量。删除终结点后，不会继续产生费用。

提示

若要详细了解如何跟踪成本，请参阅监视通过 Azure 市场提供的模型的成本。

Azure AI Foundry 鼓励客户探索部署选项并选取最适合其业务和技术需求的选项。一般来说，你可以采用以下思考过程：

从范围更广的部署选项开始。这样就可以在应用程序中更快地进行迭代和原型设计，而无需在每次决定更改某些内容时重建体系结构。 Azure AI 模型推理是一个部署目标，它支持 Azure AI 目录中的所有旗舰模型，包括来自 Azure OpenAI 的最新创新。如果要开始使用，请按照配置 AI 项目以使用 Azure AI 模型推理操作。
想要使用特定模型时：
1. 如果你对 Azure OpenAI 模型感兴趣，可使用 Azure OpenAI 服务，该服务提供各种适合它们的功能，是专为它们设计的。
2. 如果你对模型即服务中的特定模型感兴趣，不希望使用任何其他类型的模型，请使用无服务器 API 终结点。它们允许在一组唯一的终结点 URL 和密钥下部署单个模型。
如果模型在模型即服务中不可用，并且订阅中有可用的计算配额，请使用支持部署开放和自定义模型的托管计算。它还允许对部署推理服务器、协议和详细配置进行高级别的自定义。

提示

每个部署选项可能在网络、安全性以及内容安全之类的附加功能方面提供不同的功能。请查看相应的文档以了解它们的局限性。