你当前正在访问 Microsoft Azure Global Edition 技术文档网站。 如果需要访问由世纪互联运营的 Microsoft Azure 中国技术文档网站,请访问 https://docs.azure.cn。
什么是 Azure AI 模型推理服务?
Azure AI 模型推理服务可让你访问 Azure AI 模型目录中提供的最强大的模型。 这些模型来自业内的主要模型提供商,其中包括 OpenAI、Microsoft、Meta、Mistral、Cohere、G42 和 AI21 Labs;这些模型可以与软件解决方案集成,完成包括内容生成、汇总、图像理解、语义搜索和代码生成在内的广泛任务。
Azure AI 模型推理服务提供了一种方法,可以将模型作为 API 使用,而无需将其托管在基础结构上。 模型托管在 Microsoft 管理的基础结构中,这使得对模型提供商模型的基于 API 的访问成为可能。 基于 API 的访问可以大幅降低访问模型的成本并简化预配体验。
模型
你可以访问业内的主要模型提供商,其中包括 OpenAI、Microsoft、Meta、Mistral、Cohere、G42 和 AI21 Labs。 模型提供商将为其模型定义许可条款并规定价格。 以下列表显示所有可用的模型:
模型提供商 | 模型 |
---|---|
AI21 Labs | - AI21-Jamba-1.5-Mini - AI21-Jamba-1.5-Large |
Azure OpenAI | - o1-preview(请求访问权限) - o1-mini(请求访问权限) - gpt-4o-mini - gpt-4o - text-embedding-3-small - text-embedding-3-large |
Cohere | - Cohere-command-r-plus-08-2024 - Cohere-command-r-08-2024 - Cohere-embed-v3-multilingual - Cohere-embed-v3-english - Cohere-command-r-plus - Cohere-command-r |
元 AI | - Meta-Llama-3-8B-Instruct - Meta-Llama-3-70B-Instruct - Meta-Llama-3.1-8B-Instruct - Meta-Llama-3.1-70B-Instruct - Meta-Llama-3.1-405B-Instruct - Llama-3.2-11B-Vision-Instruct - Llama-3.2-90B-Vision-Instruct |
Mistral AI | - Mistral-Small - Mistral-Nemo - Mistral-large - Mistral-large-2407 |
Microsoft | - Phi-3-mini-4k-instruct - Phi-3-medium-4k-instruct - Phi-3-mini-128k-instruct - Phi-3-medium-128k-instruct - Phi-3-small-8k-instruct - Phi-3-small-128k-instruct - Phi-3.5-vision-instruct - Phi-3.5-mini-instruct - Phi-3.5-MoE-instruct |
可以在创建的资源中决定并配置适用于推理的具体模型。 配置给定模型后,可以通过在请求中指明其模型名称或部署名称来从中生成预测。 无需在代码中进行进一步更改即可使用它。
若要了解如何将模型添加到 Azure AI 模型推理资源并使用它们,请阅读在 Azure AI 模型推理中将模型添加到 Azure AI 模型并对其进行配置。
定价
非 Microsoft 提供商提供的模型(例如元 AI 和 Mistral 模型)通过 Azure 市场计费。 对于此类模型,需要根据 Microsoft 商业市场使用条款订阅特定模型产品/服务。 用户接受使用模型时所要遵守的许可条款。 在部署期间将提供所用模型的定价信息。
Microsoft 提供的模型(例如 Phi-3 模型和 Azure OpenAI 模型)没有此要求,它们通过 Azure 计量作为第一方消费服务计费。 如产品条款中所述,可以使用 Azure 计量器购买第一方消费服务,但它们不受 Azure 服务条款的约束。