共用方式為


Azure AI 模型推斷中可用的模型

Azure AI Foundry 中的 Azure AI 模型推斷可讓您存取 Azure AI 中的旗艦模型,以取用它們作為 API,而不需要將它們裝載在您的基礎結構上。

提示

DeepSeek-R1 (預覽版) 可用於部署為 無伺服器 API 端點

顯示 Azure AI Studio 模型目錄區段和可用模型的動畫。

模型可用性會因模型提供者、部署 SKU 和雲端而異。 Azure AI 模型推斷中提供的所有模型都支援 使用全域容量來保證輸送量的全域標準 部署類型。 Azure OpenAI 模型 也支持區域部署和 主權雲端:Azure Government、Azure 德國和 Azure China 21Vianet。

深入瞭解 Azure OpenAI 的特定部署功能,請參閱 Azure OpenAI 模型可用性

提示

Azure AI 模型目錄提供較大型的模型選擇,從較大的提供者範圍。 不過,這些模型可能需要您在基礎結構上裝載它們,包括建立 AI 中樞和專案。 Azure AI 模型服務可讓您使用隨用隨付計費,以 API 的形式取用模型作為 API,而不需要將它們裝載在您的基礎結構上。 深入瞭解 Azure AI 模型目錄

您可以在 Azure AI Foundry 入口網站的模型目錄中看到所有可用的模型。

AI21 Labs

Jamba 系列模型是 AI21 的生產級 Mamba 型大型語言模型 (LLM),其使用 AI21 的混合式 Mamba-Transformer 架構。 這是 AI21 混合式結構化狀態空間模型 (SSM) 轉換器 Jamba 模型的指令微調版本。 Jamba 系列模型的建置目的是在商業用途上提供可靠的品質和效能。

模型 類型 Capabilities
AI21-Jamba-1.5-Mini 聊天完成 全域標準 - 輸入: 文字(262,144 個令牌)
- 輸出: (4,096 個令牌)
- 語言:enfr、、esdeptar、 和he
- 工具呼叫:
- 回應格式: 文字、JSON、結構化輸出
AI21-Jamba-1.5-Large 聊天完成 全域標準 - 輸入: 文字(262,144 個令牌)
- 輸出: (4,096 個令牌)
- 語言:enfr、、esdeptar、 和he
- 工具呼叫:
- 回應格式: 文字、JSON、結構化輸出

請參閱 Azure AI Foundry 入口網站中的此模型集合。

Azure OpenAI

Azure OpenAI 服務提供具有不同功能和價格點的多種模型集合。 這些模型包括:

  • 設計用來解決推理和解決問題工作的最先進的模型,並增加專注力和能力
  • 可瞭解併產生自然語言和程序代碼的模型
  • 可將語音轉譯和翻譯為文字的模型
模型 類型 Capabilities
o1 聊天完成 全域標準 - 輸入: 文字和影像 (200,000 個令牌)
- 輸出: 文字(100,000 個令牌)
- 語言:、、、idruaffrukkotrswplelarurzheslvnepamrcybnjadethis 和 。teiten
- 工具呼叫:
- 回應格式: 文字、JSON、結構化輸出
o1-preview 聊天完成 全域標準
標準
- 輸入: 文字(128,000 個令牌)
- 輸出: (32,768 個令牌)
- 語言:、、、idruaffrukkotrswplelarurzheslvnepamrcybnjadethis 和 。teiten
- 工具呼叫:
- 回應格式: 文字、JSON、結構化輸出
o1-mini 聊天完成 全域標準
標準
- 輸入: 文字(128,000 個令牌)
- 輸出: (65,536 個令牌)
- 語言:、、、idruaffrukkotrswplelarurzheslvnepamrcybnjadethis 和 。teiten
- 工具呼叫:
- 回應格式: 文字、JSON、結構化輸出
gpt-4o-realtime-preview real-time 全域標準 - 輸入: 控制項、文字和音訊(131,072 標記)
- 輸出: 文字和音訊 (16,384 標記)
- 語言: en
- 工具呼叫:
- 回應格式: 文字、JSON
gpt-4o 聊天完成 全域標準
標準
Batch
已佈建
全域佈建
數據區
- 輸入: 文字和影像 (131,072 令牌)
- 輸出: 文字(16,384 個令牌)
- 語言:、、、idruaffrukkotrswplelarurzheslvnepamrcybnjadethis 和 。teiten
- 工具呼叫:
- 回應格式: 文字、JSON、結構化輸出
gpt-4o-mini 聊天完成 全域標準
標準
Batch
已佈建
全域佈建
數據區
- 輸入: 文字、影像和音訊 (131,072 標記)
- 輸出: (16,384 個令牌)
- 語言:、、、idruaffrukkotrswplelarurzheslvnepamrcybnjadethis 和 。teiten
- 工具呼叫:
- 回應格式: 文字、JSON、結構化輸出
text-embedding-3-large 內嵌 全域標準
標準
已佈建
全域佈建
- 輸入: 文字 (8,191 標記)
- 輸出: 向量 (3,072 dim.)
- 語言:en
text-embedding-3-small 內嵌 全域標準
標準
已佈建
全域佈建
- 輸入: 文字 (8,191 標記)
- 輸出: 向量 (1,536 dim.)
- 語言:en

請參閱 Azure AI Foundry 入口網站中的此模型集合。

Cohere

Cohere 系列模型包含針對不同使用案例優化的各種模型,包括聊天完成和內嵌。 Cohere 模型已針對各種使用案例 (包括推理、摘要及問題解答) 進行最佳化。

模型 類型 Capabilities
Cohere-embed-v3-english 內嵌
image-embeddings
全域標準 - 輸入: 文字 (512 標記)
- 輸出: 向量 (1,024 dim.)
- 語言: en
Cohere-embed-v3-多語系 內嵌
image-embeddings
全域標準 - 輸入: 文字 (512 標記)
- 輸出: 向量 (1,024 dim.)
- 語言: en、fr、es、it、de、pt-br、ja、ko、zh-cn 和 ar
Cohere-command-r-plus-08-2024 聊天完成 全域標準 - 輸入: 文字(131,072 個令牌)
- 輸出: (4,096 個令牌)
- 語言: en、fr、es、it、de、pt-br、ja、ko、zh-cn 和 ar
- 工具呼叫:
- 回應格式: 文字、JSON
Cohere-command-r-08-2024 聊天完成 全域標準 - 輸入: 文字(131,072 個令牌)
- 輸出: (4,096 個令牌)
- 語言: en、fr、es、it、de、pt-br、ja、ko、zh-cn 和 ar
- 工具呼叫:
- 回應格式: 文字、JSON
Cohere-command-r-plus 聊天完成 全域標準 - 輸入: 文字(131,072 個令牌)
- 輸出: (4,096 個令牌)
- 語言: en、fr、es、it、de、pt-br、ja、ko、zh-cn 和 ar
- 工具呼叫:
- 回應格式: 文字、JSON
Cohere-command-r 聊天完成 全域標準 - 輸入: 文字(131,072 個令牌)
- 輸出: (4,096 個令牌)
- 語言: en、fr、es、it、de、pt-br、ja、ko、zh-cn 和 ar
- 工具呼叫:
- 回應格式: 文字、JSON

請參閱 Azure AI Foundry 入口網站中的此模型集合。

Core42

Core42 包含阿拉伯文和英文的自動回歸雙語 LLM,具有阿拉伯文最先進的功能。

模型 類型 Capabilities
jais-30b-chat 聊天完成 全域標準 - 輸入: 文字(8,192 個令牌)
- 輸出: (4,096 個令牌)
- 語言: en 和ar
- 工具呼叫:
- 回應格式: 文字、JSON

請參閱 Azure AI Foundry 入口網站中的此模型集合。

中繼

Meta Llama 模型和工具是預先定型和微調的產生 AI 文字和影像推理模型的集合。 中繼模型範圍可調整為包含:

  • 小型語言模型(SLM),例如 1B 和 3B 基底,並指示用於裝置和邊緣推斷的模型
  • 中型大型語言模型(LLM),例如 7B、8B 和 70B 基底和指示模型
  • Meta Llama 3.1-405B 等高效能模型會指示合成數據產生和釀酒使用案例。
模型 類型 Capabilities
Llama-3.3-70B-指示 聊天完成 全域標準 - 輸入: 文字(128,000 個令牌)
- 輸出: 文字(8,192 個令牌)
- 語言: en、de、fr、it、pt、hi、es 和 th
- 工具呼叫: 否*
- 回應格式: 文字
Llama-3.2-11B-Vision-指示 聊天完成 全域標準 - 輸入: 文字和影像(128,000 個令牌)
- 輸出: (8,192 個令牌)
- 語言: en
- 工具呼叫: 否*
- 回應格式: 文字
Llama-3.2-90B-Vision-指示 聊天完成 全域標準 - 輸入: 文字和影像(128,000 個令牌)
- 輸出: (8,192 個令牌)
- 語言: en
- 工具呼叫: 否*
- 回應格式: 文字
Meta-Llama-3.1-405B-Instruct 聊天完成 全域標準 - 輸入: 文字(131,072 個令牌)
- 輸出: (8,192 個令牌)
- 語言: en、de、fr、it、pt、hi、es 和 th
- 工具呼叫: 否*
- 回應格式: 文字
Meta-Llama-3-8B-Instruct 聊天完成 全域標準 - 輸入: 文字(8,192 個令牌)
- 輸出: (8,192 個令牌)
- 語言: en
- 工具呼叫: 否*
- 回應格式: 文字
Meta-Llama-3.1-70B-Instruct 聊天完成 全域標準 - 輸入: 文字(131,072 個令牌)
- 輸出: (8,192 個令牌)
- 語言: en、de、fr、it、pt、hi、es 和 th
- 工具呼叫: 否*
- 回應格式: 文字
Meta-Llama-3.1-8B-Instruct 聊天完成 全域標準 - 輸入: 文字(131,072 個令牌)
- 輸出: (8,192 個令牌)
- 語言: en、de、fr、it、pt、hi、es 和 th
- 工具呼叫: 否*
- 回應格式: 文字
Meta-Llama-3-70B-Instruct 聊天完成 全域標準 - 輸入: 文字(8,192 個令牌)
- 輸出: (8,192 個令牌)
- 語言: en
- 工具呼叫: 否*
- 回應格式: 文字

請參閱 Azure AI Foundry 入口網站中的此模型集合。

Microsoft

Phi 是一系列輕量型、最先進的開放式車型。 這些模型是使用 Phi-3 數據集進行定型。 數據集包括綜合數據和已篩選且公開可用的網站數據,著重於高品質和推理密集的屬性。 模型歷經嚴格的產品功能加強流程,納入了受監督的微調、近端原則最佳化,以及直接喜好設定最佳化,以確保精確的指令遵循和強固的安全措施。

模型 類型 Capabilities
Phi-3-mini-128k-指示 聊天完成 全域標準 - 輸入: 文字(131,072 個令牌)
- 輸出: (4,096 個令牌)
- 語言: en
- 工具呼叫:
- 回應格式: 文字
Phi-3-mini-4k-指示 聊天完成 全域標準 - 輸入: 文字(4,096 個令牌)
- 輸出: (4,096 個令牌)
- 語言: en
- 工具呼叫:
- 回應格式: 文字
Phi-3-small-8k-指示 聊天完成 全域標準 - 輸入: 文字(131,072 個令牌)
- 輸出: (4,096 個令牌)
- 語言: en
- 工具呼叫:
- 回應格式: 文字
Phi-3-medium-128k-instruct 聊天完成 全域標準 - 輸入: 文字(131,072 個令牌)
- 輸出: (4,096 個令牌)
- 語言: en
- 工具呼叫:
- 回應格式: 文字
Phi-3-medium-4k-指示 聊天完成 全域標準 - 輸入: 文字(4,096 個令牌)
- 輸出: (4,096 個令牌)
- 語言: en
- 工具呼叫:
- 回應格式: 文字
Phi-3.5-vision-指示 聊天完成 全域標準 - 輸入: 文字和影像 (131,072 令牌)
- 輸出: (4,096 個令牌)
- 語言: en
- 工具呼叫:
- 回應格式: 文字
Phi-3.5-MoE-指示 聊天完成 全域標準 - 輸入: 文字(131,072 個令牌)
- 輸出: 文字(4,096 個令牌)
- 語言: en、ar、zh、cs、da、nl、fi、fr、de、he、胡、it、ja、ko、no、pl、pt、ru、es、sv、th、tr 和 uk
- 工具呼叫:
- 回應格式: 文字
Phi-3-small-128k-instruct 聊天完成 全域標準 - 輸入: 文字(131,072 個令牌)
- 輸出: (4,096 個令牌)
- 語言: en
- 工具呼叫:
- 回應格式: 文字
Phi-3.5-mini-指示 聊天完成 全域標準 - 輸入: 文字(131,072 個令牌)
- 輸出: (4,096 個令牌)
- 語言: en、ar、zh、cs、da、nl、fi、fr、de、he、胡、it、ja、ko、no、pl、pt、ru、es、sv、th、tr 和 uk
- 工具呼叫:
- 回應格式: 文字
Phi-4 聊天完成 全域標準 - 輸入: 文字(16,384 個令牌)
- 輸出: (16,384 個令牌)
- 語言: en, ar, bn, cs, da, de, el, es, fa, fi, fr, gu, ha, he, hi, 胡, id, it, ja, jv, kn, ko, ml, mr, nl, no, or, pa, pl, ps, pt, ro, ru, sv, sw, ta, te, th, tl, tr, uk, your, vi, yo, and zh - Tool calling: No
- 回應格式: 文字

請參閱 Azure AI Foundry 入口網站中的此模型集合。

Mistral AI

Mistral AI 提供兩種模型類別:進階模型,包括Mistral Large和Mistral Small,以及開放式模型,包括Mistral Nemo。

模型 類型 Capabilities
部長-3B 聊天完成 全域標準 - 輸入: 文字(131,072 個令牌)
- 輸出: 文字(4,096 個令牌)
- 語言: fr、de、es、it 和 en
- 工具呼叫:
- 回應格式: 文字、JSON
Mistral-large 聊天完成 全域標準 - 輸入: 文字(32,768 個令牌)
- 輸出: (4,096 個令牌)
- 語言: fr、de、es、it 和 en
- 工具呼叫:
- 回應格式: 文字、JSON
Mistral-small 聊天完成 全域標準 - 輸入: 文字(32,768 個令牌)
- 輸出: 文字(4,096 個令牌)
- 語言: fr、de、es、it 和 en
- 工具呼叫:
- 回應格式: 文字、JSON
Mistral-Nemo 聊天完成 全域標準 - 輸入: 文字(131,072 個令牌)
- 輸出: 文字(4,096 個令牌)
- 語言: en、fr、de、es、it、zh、ja、ko、pt、nl 和 pl
- 工具呼叫:
- 回應格式: 文字、JSON
Mistral-large-2407 聊天完成 全域標準 - 輸入: 文字(131,072 個令牌)
- 輸出: (4,096 個令牌)
- 語言: en、fr、de、es、it、zh、ja、ko、pt、nl 和 pl
- 工具呼叫:
- 回應格式: 文字、JSON
Mistral-Large-2411 聊天完成 全域標準 - 輸入: 文字(128,000 個令牌)
- 輸出: 文字(4,096 個令牌)
- 語言: en、fr、de、es、it、zh、ja、ko、pt、nl 和 pl
- 工具呼叫:
- 回應格式: 文字、JSON
Codestral-2501 聊天完成 全域標準 - 輸入: 文字(262,144 個令牌)
- 輸出: 文字(4,096 個令牌)
- 語言: en
- 工具呼叫:
- 回應格式: 文字

請參閱 Azure AI Foundry 入口網站中的此模型集合。

NTT 資料

Tsuzumi 是自動回歸語言優化轉換器。 微調版本會使用受監督的微調 (SFT)。 Tsuzumi 以高效率處理日文和英文。

模型 類型 Capabilities
Tsuzumi-7b 聊天完成 全域標準 - 輸入: 文字(8,192 個令牌)
- 輸出: 文字(8,192 個令牌)
- 語言: en 和 jp
- 工具呼叫:
- 回應格式: 文字

下一步