你当前正在访问 Microsoft Azure Global Edition 技术文档网站。 如果需要访问由世纪互联运营的 Microsoft Azure 中国技术文档网站,请访问 https://docs.azure.cn

什么是 Azure AI 模型推理?

Azure AI 模型推理可让你访问 Azure AI 模型目录中提供的最强大的模型。 这些模型来自业内的主要模型提供商,其中包括 OpenAI、Microsoft、Meta、Mistral、Cohere、G42 和 AI21 Labs。 这些模型可与软件解决方案集成,以完成各种任务,包括内容生成、摘要、图像理解、语义搜索和代码生成。

提示

DeepSeek-R1 可用于部署为无服务器 API 终结点

Azure AI 模型推理提供了一种方法,可以将模型作为 API 使用,而无需将其托管在基础结构上。 模型托管在 Microsoft 管理的基础结构中,这使得对模型提供商模型的基于 API 的访问成为可能。 基于 API 的访问可以大幅降低访问模型的成本并简化预配体验。

Azure AI 模型推理是 Azure AI 服务的一部分,用户可以通过 REST API多种语言的 SDK(如 Python、C#、JavaScript 和 Java)访问该服务。 还可以通过配置连接来使用 Azure AI Foundry 中的 Azure AI 模型推理。

模型

你可以访问业内的主要模型提供商,其中包括 OpenAI、Microsoft、Meta、Mistral、Cohere、G42 和 AI21 Labs。 模型提供商将为其模型定义许可条款并规定价格。 以下列表显示所有可用的模型:

提示

有关模型、功能和详细信息的详细视图,请参阅模型一文。

提供程序 模型
AI21 Labs - AI21-Jamba-1.5-Mini
- AI21-Jamba-1.5-Large
Azure OpenAI - o1
- gpt-4o
- o1-preview
- o1-mini
- gpt-4o-mini
- text-embedding-3-large
- text-embedding-3-small
Cohere - Cohere-embed-v3-english
- Cohere-embed-v3-multilingual
- Cohere-command-r-plus-08-2024
- Cohere-command-r-08-2024
- Cohere-command-r-plus
- Cohere-command-r
Core42 - jais-30b-chat
元数据 - Llama-3.3-70B-Instruct
- Llama-3.2-11B-Vision-Instruct
- Llama-3.2-90B-Vision-Instruct
- Meta-Llama-3.1-405B-Instruct
- Meta-Llama-3-8B-Instruct
- Meta-Llama-3.1-70B-Instruct
- Meta-Llama-3.1-8B-Instruct
- Meta-Llama-3-70B-Instruct
Microsoft - Phi-3-mini-128k-instruct
- Phi-3-mini-4k-instruct
- Phi-3-small-8k-instruct
- Phi-3-medium-128k-instruct
- Phi-3-medium-4k-instruct
- Phi-3.5-vision-instruct
- Phi-3.5-MoE-instruct
- Phi-3-small-128k-instruct
- Phi-3.5-mini-instruct
- Phi-4
Mistral AI - Ministral-3B
- Mistral-large
- Mistral-small
- Mistral-Nemo
- Mistral-large-2407
- Mistral-Large-2411
- Codestral-2501
NTT 数据 - Tsuzumi-7b

定价

对于来自非 Microsoft 提供商(例如 Meta AI 和 Mistral 模型)的模型,计费是通过 Azure 市场进行的。 对于此类模型,需要根据 Microsoft 商业市场使用条款订阅特定模型产品/服务。 用户接受使用模型时所要遵守的许可条款。 在部署期间将提供所用模型的定价信息。

对于 Microsoft 模型(例如 Phi-3 模型和 Azure OpenAI 模型),计费通过 Azure 计量作为第一方消耗服务进行。 如产品条款中所述,可以使用 Azure 计量器购买第一方消费服务,但它们不受 Azure 服务条款的约束。

提示

了解如何在 Azure AI 模型推理中监视和管理成本

负责任 AI

Microsoft 致力于遵照“以人为本”的原则推动 AI 的进步。 生成性模型(例如 AzureAI 模型中提供的模型)提供显著的潜在优势,但如果不经过精心设计和采用全方位的缓解措施,此类模型有可能会生成错误甚至有害的内容。

Microsoft 会采取以下措施帮助防止滥用和意外伤害:

入门

Azure AI 模型推理是 Azure AI 服务资源上的新功能产品/服务。 与其他 Azure 产品一样,可以在 Azure 订阅中创建和配置用于 Azure AI 模型推理的资源或服务实例,然后开始使用。 可以根据需要创建任意数量的资源,并独立配置资源,以防有多个团队具有不同的要求。

创建 Azure AI 服务资源后,必须先部署模型,然后才能开始进行 API 调用。 默认情况下,其上没有可用的模型,因此你可以控制要从哪个模型开始。 请参阅教程在 Azure AI 模型推理中创建第一个模型部署

后续步骤