你当前正在访问 Microsoft Azure Global Edition 技术文档网站。 如果需要访问由世纪互联运营的 Microsoft Azure 中国技术文档网站,请访问 https://docs.azure.cn。
什么是 Azure AI 模型推理?
Azure AI 模型推理可让你访问 Azure AI 模型目录中提供的最强大的模型。 这些模型来自业内的主要模型提供商,其中包括 OpenAI、Microsoft、Meta、Mistral、Cohere、G42 和 AI21 Labs。 这些模型可与软件解决方案集成,以完成各种任务,包括内容生成、摘要、图像理解、语义搜索和代码生成。
Azure AI 模型推理提供了一种方法,可以将模型作为 API 使用,而无需将其托管在基础结构上。 模型托管在 Microsoft 管理的基础结构中,这使得对模型提供商模型的基于 API 的访问成为可能。 基于 API 的访问可以大幅降低访问模型的成本并简化预配体验。
Azure AI 模型推理是 Azure AI 服务的一部分,用户可以通过 REST API、多种语言的 SDK(如 Python、C#、JavaScript 和 Java)访问该服务。 还可以通过配置连接来使用 Azure AI Foundry 中的 Azure AI 模型推理。
模型
你可以访问业内的主要模型提供商,其中包括 OpenAI、Microsoft、Meta、Mistral、Cohere、G42 和 AI21 Labs。 模型提供商将为其模型定义许可条款并规定价格。 以下列表显示所有可用的模型:
提示
有关模型、功能和详细信息的详细视图,请参阅模型一文。
提供程序 | 模型 |
---|---|
AI21 Labs | - AI21-Jamba-1.5-Mini - AI21-Jamba-1.5-Large |
Azure OpenAI | - o1 - gpt-4o - o1-preview - o1-mini - gpt-4o-mini - text-embedding-3-large - text-embedding-3-small |
Cohere | - Cohere-embed-v3-english - Cohere-embed-v3-multilingual - Cohere-command-r-plus-08-2024 - Cohere-command-r-08-2024 - Cohere-command-r-plus - Cohere-command-r |
Core42 | - jais-30b-chat |
元数据 | - Llama-3.3-70B-Instruct - Llama-3.2-11B-Vision-Instruct - Llama-3.2-90B-Vision-Instruct - Meta-Llama-3.1-405B-Instruct - Meta-Llama-3-8B-Instruct - Meta-Llama-3.1-70B-Instruct - Meta-Llama-3.1-8B-Instruct - Meta-Llama-3-70B-Instruct |
Microsoft | - Phi-3-mini-128k-instruct - Phi-3-mini-4k-instruct - Phi-3-small-8k-instruct - Phi-3-medium-128k-instruct - Phi-3-medium-4k-instruct - Phi-3.5-vision-instruct - Phi-3.5-MoE-instruct - Phi-3-small-128k-instruct - Phi-3.5-mini-instruct - Phi-4 |
Mistral AI | - Ministral-3B - Mistral-large - Mistral-small - Mistral-Nemo - Mistral-large-2407 - Mistral-Large-2411 - Codestral-2501 |
NTT 数据 | - Tsuzumi-7b |
定价
对于来自非 Microsoft 提供商(例如 Meta AI 和 Mistral 模型)的模型,计费是通过 Azure 市场进行的。 对于此类模型,需要根据 Microsoft 商业市场使用条款订阅特定模型产品/服务。 用户接受使用模型时所要遵守的许可条款。 在部署期间将提供所用模型的定价信息。
对于 Microsoft 模型(例如 Phi-3 模型和 Azure OpenAI 模型),计费通过 Azure 计量作为第一方消耗服务进行。 如产品条款中所述,可以使用 Azure 计量器购买第一方消费服务,但它们不受 Azure 服务条款的约束。
提示
了解如何在 Azure AI 模型推理中监视和管理成本。
负责任 AI
Microsoft 致力于遵照“以人为本”的原则推动 AI 的进步。 生成性模型(例如 AzureAI 模型中提供的模型)提供显著的潜在优势,但如果不经过精心设计和采用全方位的缓解措施,此类模型有可能会生成错误甚至有害的内容。
Microsoft 会采取以下措施帮助防止滥用和意外伤害:
- 纳入 Microsoft 负责任的 AI 使用原则
- 采用行为准则来使用服务
- 构建内容筛选器以支持客户
- 提供负责任的 AI 信息和指导客户在使用 Azure OpenAI 时应考虑的信息和指南。
入门
Azure AI 模型推理是 Azure AI 服务资源上的新功能产品/服务。 与其他 Azure 产品一样,可以在 Azure 订阅中创建和配置用于 Azure AI 模型推理的资源或服务实例,然后开始使用。 可以根据需要创建任意数量的资源,并独立配置资源,以防有多个团队具有不同的要求。
创建 Azure AI 服务资源后,必须先部署模型,然后才能开始进行 API 调用。 默认情况下,其上没有可用的模型,因此你可以控制要从哪个模型开始。 请参阅教程在 Azure AI 模型推理中创建第一个模型部署。