你当前正在访问 Microsoft Azure Global Edition 技术文档网站。 如果需要访问由世纪互联运营的 Microsoft Azure 中国技术文档网站,请访问 https://docs.azure.cn。
Azure AI 模型推理中提供的模型
Azure AI Foundry 中的 Azure AI 模型推理使你能够访问 Azure AI 中的旗舰模型,以将其用作 API,而无需在基础结构上托管它们。
模型可用性因模型提供商、部署 SKU 和云而异。 Azure AI 模型推理中提供的所有模型都支持使用全局容量保证吞吐量的全局标准部署类型。 Azure OpenAI 模型还支持区域部署和主权云 – Azure 政府、Azure 德国和 Azure 中国世纪互联。
在 Azure OpenAI 模型可用性中详细了解 Azure OpenAI 的特定部署功能。
提示
Azure AI 模型目录提供来自更广泛的提供商的丰富模型选择。 但是,这些模型可能需要你在基础结构上托管它们,包括创建 AI 中心和项目。 Azure AI 模型服务提供了一种将模型用作 API 的方法,而无需在基础结构上托管它们,并提供即用即付计费。 详细了解 Azure AI 模型目录。
可以在 Azure AI Foundry 门户的模型目录中查看所有可用的模型。
AI21 Labs
Jamba 系列模型是 AI21 基于 Mamba 的生产级大型语言模型 (LLM),它使用 AI21 的混合 Mamba-Transformer 体系结构。 它是 AI21 混合结构化状态空间模型 (SSM) 转换器 Jamba 模型经过了指令优化的版本。 Jamba 系列模型专用于可靠的商业用途,可提供出色的质量和性能。
型号 | 类型 | 层 | 功能 |
---|---|---|---|
AI21-Jamba-1.5-Mini | chat-completion | 全球标准 |
-
输入:文本(262,144 个标记) - 输出:(4,096 个标记) - 语言: en 、fr 、es 、pt 、de 、ar 、he - 工具调用:是 - 响应格式:文本、JSON、结构化输出 |
AI21-Jamba-1.5-Large | chat-completion | 全球标准 |
-
输入:文本(262,144 个标记) - 输出:(4,096 个标记) - 语言: en 、fr 、es 、pt 、de 、ar 、he - 工具调用:是 - 响应格式:文本、JSON、结构化输出 |
请参阅 Azure AI Foundry 门户中的此模型集合。
Azure OpenAI
Azure OpenAI 服务提供了一组不同的模型,分别具有不同的功能和价位。 这些模型包括:
- 为处理推理任务和问题解决任务设计的最先进的模型,具有更好的针对性和功能
- 可以理解和生成自然语言和代码的模型
- 可以将语音听录和翻译为文本的模型
型号 | 类型 | 层 | 功能 |
---|---|---|---|
o3-mini | chat-completion | 全球标准 |
-
输入:文本和图像(200,000 个标记) - 输出:文本(100,000 个标记) - 语言: en 、it 、af 、es 、de 、fr 、id 、ru 、pl 、uk 、el 、lv 、zh 、ar 、tr 、ja 、sw 、cy 、ko 、is 、bn 、ur 、ne 、th 、pa 、mr 、te 。 - 工具调用:是 - 响应格式:文本、JSON、结构化输出 |
o1 | chat-completion | 全球标准 |
-
输入:文本和图像(200,000 个标记) - 输出:文本(100,000 个标记) - 语言: en 、it 、af 、es 、de 、fr 、id 、ru 、pl 、uk 、el 、lv 、zh 、ar 、tr 、ja 、sw 、cy 、ko 、is 、bn 、ur 、ne 、th 、pa 、mr 、te 。 - 工具调用:是 - 响应格式:文本、JSON、结构化输出 |
o1-preview | chat-completion | 全球标准 Standard |
-
输入:文本(128,000 个标记) - 输出:(32,768 个标记) - 语言: en 、it 、af 、es 、de 、fr 、id 、ru 、pl 、uk 、el 、lv 、zh 、ar 、tr 、ja 、sw 、cy 、ko 、is 、bn 、ur 、ne 、th 、pa 、mr 、te 。 - 工具调用:是 - 响应格式:文本、JSON、结构化输出 |
o1-mini | chat-completion | 全球标准 Standard |
-
输入:文本(128,000 个标记) - 输出:(65,536 个标记) - 语言: en 、it 、af 、es 、de 、fr 、id 、ru 、pl 、uk 、el 、lv 、zh 、ar 、tr 、ja 、sw 、cy 、ko 、is 、bn 、ur 、ne 、th 、pa 、mr 、te 。 - 工具调用:无 - 响应格式:文本 |
gpt-4o-realtime-preview | 实时 | 全球标准 |
-
输入:控制、文本和音频(131,072 个标记) - 输出:文本和音频(16,384 个标记) - 语言:en - 工具调用:是 - 响应格式:文本、JSON |
gpt-4o | chat-completion | 全球标准 Standard 批处理 已预配 全局预配 数据区域 |
-
输入:文本和图像(131,072 个标记) - 输出:文本(16,384 个标记) - 语言: en 、it 、af 、es 、de 、fr 、id 、ru 、pl 、uk 、el 、lv 、zh 、ar 、tr 、ja 、sw 、cy 、ko 、is 、bn 、ur 、ne 、th 、pa 、mr 、te 。 - 工具调用:是 - 响应格式:文本、JSON、结构化输出 |
gpt-4o-mini | chat-completion | 全球标准 Standard 批处理 已预配 全局预配 数据区域 |
-
输入:文本、图像和音频(131,072 个标记) - 输出:(16,384 个标记) - 语言: en 、it 、af 、es 、de 、fr 、id 、ru 、pl 、uk 、el 、lv 、zh 、ar 、tr 、ja 、sw 、cy 、ko 、is 、bn 、ur 、ne 、th 、pa 、mr 、te 。 - 工具调用:是 - 响应格式:文本、JSON、结构化输出 |
text-embedding-3-large | 嵌入 | 全球标准 Standard 已预配 全局预配 |
-
输入:文本(8,191 个标记) - 输出:矢量(3,072 dim.) - 语言: en |
text-embedding-3-small | 嵌入 | 全球标准 Standard 已预配 全局预配 |
-
输入:文本(8,191 个标记) - 输出:矢量(1,536 dim.) - 语言: en |
请参阅 Azure AI Foundry 门户中的此模型集合。
Cohere
Cohere 模型系列包括针对不同用例优化的各种模型,其中包括聊天补全和嵌入。 Cohere 模型针对各种用例进行了优化,包括推理、总结和问答。
型号 | 类型 | 层 | 功能 |
---|---|---|---|
Cohere-embed-v3-english | 嵌入 image-embeddings |
全球标准 |
-
输入:文本(512 个标记) - 输出:矢量(1,024 dim.) - 语言:en |
Cohere-embed-v3-multilingual | 嵌入 image-embeddings |
全球标准 |
-
输入:文本(512 个标记) - 输出:矢量(1,024 dim.) - 语言:en、fr、es、it、de、pt-br、ja、ko、zh-cn 和 ar |
Cohere-command-r-plus-08-2024 | chat-completion | 全球标准 |
-
输入:文本(131,072 个标记) - 输出:(4,096 个标记) - 语言:en、fr、es、it、de、pt-br、ja、ko、zh-cn 和 ar - 工具调用:是 - 响应格式:文本、JSON |
Cohere-command-r-08-2024 | chat-completion | 全球标准 |
-
输入:文本(131,072 个标记) - 输出:(4,096 个标记) - 语言:en、fr、es、it、de、pt-br、ja、ko、zh-cn 和 ar - 工具调用:是 - 响应格式:文本、JSON |
Cohere-command-r-plus | chat-completion | 全球标准 |
-
输入:文本(131,072 个标记) - 输出:(4,096 个标记) - 语言:en、fr、es、it、de、pt-br、ja、ko、zh-cn 和 ar - 工具调用:是 - 响应格式:文本、JSON |
Cohere-command-r | chat-completion | 全球标准 |
-
输入:文本(131,072 个标记) - 输出:(4,096 个标记) - 语言:en、fr、es、it、de、pt-br、ja、ko、zh-cn 和 ar - 工具调用:是 - 响应格式:文本、JSON |
请参阅 Azure AI Foundry 门户中的此模型集合。
Core42
Core42 包含阿拉伯语和英语的自回归双语 LLM,在阿拉伯语中具有最先进的功能。
型号 | 类型 | 层 | 功能 |
---|---|---|---|
jais-30b-chat | chat-completion | 全球标准 |
-
输入:文本(8,192 个标记) - 输出:(4,096 个标记) - 语言:en 和 ar - 工具调用:是 - 响应格式:文本、JSON |
请参阅 Azure AI Foundry 门户中的此模型集合。
DeepSeek
DeepSeek 系列模型包括 DeepSeek-R1,它擅长使用分步训练过程的推理任务,如语言、科学推理和编码任务。
型号 | 类型 | 层 | 功能 |
---|---|---|---|
DeekSeek-R1 | chat-completion (具有推理内容) |
全球标准 |
-
输入:文本(16,384 个标记) - 输出:(163,840 个标记) - 语言: en 和 zh - 工具调用:无 - 响应格式:文本。 |
请参阅 Azure AI Foundry 门户中的此模型集合。
元
Meta Llama 模型和工具是预训练和微调的生成式 AI 文本和图像推理模型的集合。 元模型的范围包括:
- 小型语言模型 (SLM),如 1B 和 3B Base 模型,以及用于设备和边缘推理的 Instruct 模型
- 中等大型语言模型 (LLM),如 7B、8B 和 70B Base 模型和 Instruct 模型
- 高性能模型(如 Meta Llama 3.1-405B Instruct),用于合成数据生成和蒸馏用例。
型号 | 类型 | 层 | 功能 |
---|---|---|---|
Llama-3.3-70B-Instruct | chat-completion | 全球标准 |
-
输入:文本(128,000 个标记) - 输出:文本(8,192 个标记) - 语言:en、de、fr、it、pt、hi、es 和 th - 工具调用:无* - 响应格式:文本 |
Llama-3.2-11B-Vision-Instruct | chat-completion | 全球标准 |
-
输入:文本和图像(128,000 个标记) - 输出:(8,192 个标记) - 语言:en - 工具调用:无* - 响应格式:文本 |
Llama-3.2-90B-Vision-Instruct | chat-completion | 全球标准 |
-
输入:文本和图像(128,000 个标记) - 输出:(8,192 个标记) - 语言:en - 工具调用:无* - 响应格式:文本 |
Meta-Llama-3.1-405B-Instruct | chat-completion | 全球标准 |
-
输入:文本(131,072 个标记) - 输出:(8,192 个标记) - 语言:en、de、fr、it、pt、hi、es 和 th - 工具调用:无* - 响应格式:文本 |
Meta-Llama-3-8B-Instruct | chat-completion | 全球标准 |
-
输入:文本(8,192 个标记) - 输出:(8,192 个标记) - 语言:en - 工具调用:无* - 响应格式:文本 |
Meta-Llama-3.1-70B-Instruct | chat-completion | 全球标准 |
-
输入:文本(131,072 个标记) - 输出:(8,192 个标记) - 语言:en、de、fr、it、pt、hi、es 和 th - 工具调用:无* - 响应格式:文本 |
Meta-Llama-3.1-8B-Instruct | chat-completion | 全球标准 |
-
输入:文本(131,072 个标记) - 输出:(8,192 个标记) - 语言:en、de、fr、it、pt、hi、es 和 th - 工具调用:无* - 响应格式:文本 |
Meta-Llama-3-70B-Instruct | chat-completion | 全球标准 |
-
输入:文本(8,192 个标记) - 输出:(8,192 个标记) - 语言:en - 工具调用:无* - 响应格式:文本 |
请参阅 Azure AI Foundry 门户中的此模型集合。
Microsoft
Phi 是一系列轻型、最先进的开放模型。 这些模型是使用 Phi-3 数据集训练的。 该数据集包括合成数据和经过筛选的、公开可用的网站数据,侧重于高质量和推理密集的属性。 模型经历了严格的增强流程,结合了监督微调、近似策略优化和直接偏好优化,可确保精确地遵循指令和实施可靠的安全措施。
型号 | 类型 | 层 | 功能 |
---|---|---|---|
Phi-3-mini-128k-instruct | chat-completion | 全球标准 |
-
输入:文本(131,072 个标记) - 输出:(4,096 个标记) - 语言:en - 工具调用:无 - 响应格式:文本 |
Phi-3-mini-4k-instruct | chat-completion | 全球标准 |
-
输入:文本(4,096 个标记) - 输出:(4,096 个标记) - 语言:en - 工具调用:无 - 响应格式:文本 |
Phi-3-small-8k-instruct | chat-completion | 全球标准 |
-
输入:文本(131,072 个标记) - 输出:(4,096 个标记) - 语言:en - 工具调用:无 - 响应格式:文本 |
Phi-3-medium-128k-instruct | chat-completion | 全球标准 |
-
输入:文本(131,072 个标记) - 输出:(4,096 个标记) - 语言:en - 工具调用:无 - 响应格式:文本 |
Phi-3-medium-4k-instruct | chat-completion | 全球标准 |
-
输入:文本(4,096 个标记) - 输出:(4,096 个标记) - 语言:en - 工具调用:无 - 响应格式:文本 |
Phi-3.5-vision-instruct | chat-completion | 全球标准 |
-
输入:文本和图像(131,072 个标记) - 输出:(4,096 个标记) - 语言:en - 工具调用:无 - 响应格式:文本 |
Phi-3.5-MoE-instruct | chat-completion | 全球标准 |
-
输入:文本(131,072 个标记) - 输出:文本(4,096 个标记) - 语言:en、ar、zh、cs、da、nl、fi、fr、de、he、hu、it、ja、ko、no、pl、pt、ru、es、sv、th、tr、uk - 工具调用:无 - 响应格式:文本 |
Phi-3-small-128k-instruct | chat-completion | 全球标准 |
-
输入:文本(131,072 个标记) - 输出:(4,096 个标记) - 语言:en - 工具调用:无 - 响应格式:文本 |
Phi-3.5-mini-instruct | chat-completion | 全球标准 |
-
输入:文本(131,072 个标记) - 输出:(4,096 个标记) - 语言:en、ar、zh、cs、da、nl、fi、fr、de、he、hu、it、ja、ko、no、pl、pt、ru、es、sv、th、tr、uk - 工具调用:无 - 响应格式:文本 |
Phi-4 | chat-completion | 全球标准 |
-
输入:文本(16,384 个标记) - 输出:(16,384 个标记) - 语言:en、ar、bn、cs、da、de、el、es、fa、fi、fr、gu、ha、he、hi、hu、id、it、ja、jv、kn、ko、ml、mr、nl、no、or、pa、pl、ps、pt、ro、ru、sv、sw、ta、te、th、tl、tr、uk、ur、vi、yo、zh - 工具调用:无 - 响应格式:文本 |
请参阅 Azure AI Foundry 门户中的此模型集合。
Mistral AI
Mistral AI 提供两类模型:高级模型(包括 Mistral Large 和 Mistral Small)和开放模型(包括 Mistral Nemo)。
型号 | 类型 | 层 | 功能 |
---|---|---|---|
Ministral-3B | chat-completion | 全球标准 |
-
输入:文本(131,072 个标记) - 输出:文本(4,096 个标记) - 语言:fr、de、es、it、en - 工具调用:是 - 响应格式:文本、JSON |
Mistral-large (已弃用) |
chat-completion | 全球标准 |
-
输入:文本(32,768 个标记) - 输出:(4,096 个标记) - 语言:fr、de、es、it、en - 工具调用:是 - 响应格式:文本、JSON |
Mistral-small | chat-completion | 全球标准 |
-
输入:文本(32,768 个标记) - 输出:文本(4,096 个标记) - 语言:fr、de、es、it、en - 工具调用:是 - 响应格式:文本、JSON |
Mistral-Nemo | chat-completion | 全球标准 |
-
输入:文本(131,072 个标记) - 输出:文本(4,096 个标记) - 语言:en、fr、de、es、it、zh、ja、ko、pt、nl、pl - 工具调用:是 - 响应格式:文本、JSON |
Mistral-large-2407 (旧版) |
chat-completion | 全球标准 |
-
输入:文本(131,072 个标记) - 输出:(4,096 个标记) - 语言:en、fr、de、es、it、zh、ja、ko、pt、nl、pl - 工具调用:是 - 响应格式:文本、JSON |
Mistral-Large-2411 | chat-completion | 全球标准 |
-
输入:文本(128,000 个标记) - 输出:文本(4,096 个标记) - 语言:en、fr、de、es、it、zh、ja、ko、pt、nl、pl - 工具调用:是 - 响应格式:文本、JSON |
Codestral-2501 | chat-completion | 全球标准 |
-
输入:文本(262,144 个标记) - 输出:文本(4,096 个标记) - 语言:en - 工具调用:无 - 响应格式:文本 |
请参阅 Azure AI Foundry 门户中的此模型集合。
NTT 数据
Tsuzumi 是一种自回归语言优化转换器。 优化版本使用监督式微调 (SFT)。 Tsuzumi 能够高效处理日语和英语。
型号 | 类型 | 层 | 功能 |
---|---|---|---|
Tsuzumi-7b | chat-completion | 全球标准 |
-
输入:文本(8,192 个标记) - 输出:文本(8,192 个标记) - 语言:en 和 jp - 工具调用:无 - 响应格式:文本 |
后续步骤
- 立即开始使用,在 Azure AI 服务中部署你的第一个模型