你当前正在访问 Microsoft Azure Global Edition 技术文档网站。如果需要访问由世纪互联运营的 Microsoft Azure 中国技术文档网站，请访问 https://docs.azure.cn。

什么是 Azure AI 模型推理？

项目
03/03/2025

Azure AI 模型推理可让你访问 Azure AI 模型目录中提供的最强大的模型。这些模型来自业内的主要模型提供商，其中包括 OpenAI、Microsoft、Meta、Mistral、Cohere、G42 和 AI21 Labs。这些模型可与软件解决方案集成，以完成各种任务，包括内容生成、摘要、图像理解、语义搜索和代码生成。

提示

若要在 Azure AI 模型推理中部署 DeepSeek-R1 或 OpenAI o3-mini，请按照添加和配置模型中的步骤操作。

Azure AI 模型推理提供了一种方法，可以将模型作为 API 使用，而无需将其托管在基础结构上。模型托管在 Microsoft 管理的基础结构中，这使得对模型提供商模型的基于 API 的访问成为可能。基于 API 的访问可以大幅降低访问模型的成本并简化预配体验。

Azure AI 模型推理是 Azure AI 服务的一部分，用户可以通过 REST API、多种语言的 SDK（如 Python、C#、JavaScript 和 Java）访问该服务。还可以通过配置连接来使用 Azure AI Foundry 中的 Azure AI 模型推理。

模型

你可以访问业内的主要模型提供商，其中包括 OpenAI、Microsoft、Meta、Mistral、Cohere、G42 和 AI21 Labs。模型提供商将为其模型定义许可条款并规定价格。以下列表显示所有可用的模型：

若要查看每个模型的详细信息，包括语言、类型和功能，请参阅模型一文。

提供程序	模型
AI21 Labs	- AI21-Jamba-1.5-Mini - AI21-Jamba-1.5-Large
Azure OpenAI	o3-mini - o1 - gpt-4o - o1-preview - o1-mini - gpt-4o-mini - text-embedding-3-large - text-embedding-3-small
Cohere	- Cohere-embed-v3-english - Cohere-embed-v3-multilingual - Cohere-command-r-plus-08-2024 - Cohere-command-r-08-2024 - Cohere-command-r-plus - Cohere-command-r
Core42	- jais-30b-chat
DeepSeek	- DeepSeek-R1
元数据	- Llama-3.3-70B-Instruct - Llama-3.2-11B-Vision-Instruct - Llama-3.2-90B-Vision-Instruct - Meta-Llama-3.1-405B-Instruct - Meta-Llama-3-8B-Instruct - Meta-Llama-3.1-70B-Instruct - Meta-Llama-3.1-8B-Instruct - Meta-Llama-3-70B-Instruct
Microsoft	- Phi-3-mini-128k-instruct - Phi-3-mini-4k-instruct - Phi-3-small-8k-instruct - Phi-3-medium-128k-instruct - Phi-3-medium-4k-instruct - Phi-3.5-vision-instruct - Phi-3.5-MoE-instruct - Phi-3-small-128k-instruct - Phi-3.5-mini-instruct - Phi-4
Mistral AI	- Ministral-3B - Mistral-large - Mistral-small - Mistral-Nemo - Mistral-large-2407 - Mistral-Large-2411 - Codestral-2501
NTT 数据	- Tsuzumi-7b

定价

对于来自非 Microsoft 提供商（例如 Meta AI 和 Mistral 模型）的模型，计费是通过 Azure 市场进行的。对于此类模型，需要根据 Microsoft 商业市场使用条款订阅特定模型产品/服务。用户接受使用模型时所要遵守的许可条款。在部署期间将提供所用模型的定价信息。

对于 Microsoft 模型（例如 Phi-3 模型和 Azure OpenAI 模型），计费通过 Azure 计量作为第一方消耗服务进行。如产品条款中所述，可以使用 Azure 计量器购买第一方消费服务，但它们不受 Azure 服务条款的约束。

提示

了解如何在 Azure AI 模型推理中监视和管理成本。

负责任 AI

Microsoft 致力于遵照“以人为本”的原则推动 AI 的进步。生成性模型（例如 AzureAI 模型中提供的模型）提供显著的潜在优势，但如果不经过精心设计和采用全方位的缓解措施，此类模型有可能会生成错误甚至有害的内容。

Microsoft 会采取以下措施帮助防止滥用和意外伤害：

纳入 Microsoft 负责任的 AI 使用原则
采用行为准则来使用服务
构建内容筛选器以支持客户
提供负责任的 AI 信息和指导客户在使用 Azure OpenAI 时应考虑的信息和指南。

入门

Azure AI 模型推理是 Azure AI 服务资源上的新功能产品/服务。与其他 Azure 产品一样，可以在 Azure 订阅中创建和配置用于 Azure AI 模型推理的资源或服务实例，然后开始使用。可以根据需要创建任意数量的资源，并独立配置资源，以防有多个团队具有不同的要求。

创建 Azure AI 服务资源后，必须先部署模型，然后才能开始进行 API 调用。默认情况下，其上没有可用的模型，因此你可以控制要从哪个模型开始。请参阅教程在 Azure AI 模型推理中创建第一个模型部署。

后续步骤

在 Azure AI 模型推理中创建第一个模型部署

通过

什么是 Azure AI 模型推理？

模型

定价

负责任 AI

入门

后续步骤

反馈

其他资源