Azure OpenAI 服務模型

發行項
02/25/2025

Azure OpenAI 服務是由一組具有不同功能和價格點的各種模型提供。模型可用性會依區域和雲端而有所不同。如需 Azure Government 模型可用性，請參閱 Azure Government OpenAI 服務。

模型	描述
o 系列模型	使用進階問題解決和增加焦點和功能的推理模型。
GPT-4o & GPT-4o 迷你 & GPT-4 Turbo	最新且功能最強大的 Azure OpenAI 模型具有多模態版本，可同時接受文字和影像作為輸入。
GPT-4o 音訊	支援低延遲的 GPT-4o 音訊模型、「語音轉換、語音輸出」交談互動或音訊產生。
GPT-4	一組在 GPT-3.5 上獲得改善的模型，可以了解及產生自然語言和程式碼。
GPT-3.5	一組在 GPT-3 上獲得改善的模型，可以了解及產生自然語言和程式碼。
內嵌	一組可將文字轉換成數值向量形式，以輔助文字相似性的模型。
DALL-E	可從自然語言產生原始影像的一系列模型。
Whisper	預覽版中的一系列模型，可將語音轉譯和翻譯為文字。
文字轉換語音 (預覽版)	預覽版中的一系列模型，可以合成文字轉換語音。

o 系列模型

Azure OpenAI o^* 系列模型特別設計用來處理專注度和功能增加的推理和解決問題工作。這些模型花費更多的時間處理和了解使用者的要求，這使得其在科學、程式碼撰寫和數學等領域比以前的迭代更加強大。

Model ID	描述	要求上限 (權杖)	定型資料 (最多)
`o3-mini` (2025-01-31)	最新的推理模型，提供增強的推理能力。 - 結構化輸出 - 純文字處理 - 函式/工具要求存取：有限的存取模型應用程式	輸入：200,000 輸出：100,000	2023 年 10 月
`o1` (2024-12-17)	o1 系列中功能最強的模型，提供增強的推理能力。 - 結構化輸出 - 文字、影像處理 - 函式/工具要求存取：有限的存取模型應用程式	輸入：200,000 輸出：100,000	2023 年 10 月
`o1-preview` (2024-09-12)	舊版預覽版本	輸入：128,000 輸出：32,768	2023 年 10 月
`o1-mini` (2024-09-12)	o1 系列中較快速且更具成本效益的選項，適用於需要速度和較低資源耗用量的編碼工作。預設提供全域標準部署。標準（地區）部署目前僅適用於在有限存取版本中收到存取 `o1-preview` 權的選取客戶。	輸入：128,000 輸出：65,536	2023 年 10 月

可用性

需要存取 o3-mini 和 o1 註冊，而且會根據Microsoft的資格準則來授與存取權。先前已套用和接收存取 o1-preview權的客戶，或 o1 不需要重新套用，因為它們會自動出現在 o 系列中最新模型的等候清單上。

要求存取：有限存取模型應用程式 (英文)

授與存取權之後，您必須為每個模型建立部署。

若要深入瞭解進階 o-series 模型，請參閱開始使用推理模型。

區域可用性

模型	區域
`o3-mini`	請參閱模型數據表。
`o1`	請參閱模型數據表。
`o1-preview`	請參閱模型數據表。此模型僅適用於在原始有限存取權中授與存取權的客戶
`o1-mini`	請參閱模型數據表。

GPT-4o 音訊

GPT 4o 音訊模型是 GPT-4o 模型系列的一部分，並支援低延遲、「語音輸入、語音輸出」交談互動或音訊產生。

GPT-4o 即時音訊的設計訴求是處理即時、低延遲的對話互動，因此非常適合支援代理程式、助理、翻譯人員，以及其他需要與用戶進行高度回應的使用案例。如需如何使用 GPT-4o 即時音訊的詳細資訊，請參閱 GPT-4o 即時音訊快速入門，以及如何使用 GPT-4o 音訊。
GPT-4o 音訊完成的設計目的是要從音訊或文字提示產生音訊，因此非常適合用來產生音訊書籍、音訊內容，以及其他需要產生音訊的使用案例。 GPT-4o 音訊完成模型會將音訊形式引入現有的 /chat/completions API。如需如何使用 GPT-4o 音訊完成的詳細資訊，請參閱音訊產生快速入門。

若要使用 GPT-4o 音訊，您需要其中一個支援區域中的 Azure OpenAI 資源。

建立資源時，您可以部署 GPT-4o 音訊模型。

下表提供最大要求令牌和定型數據的詳細數據。

Model ID	描述	要求上限 (權杖)	定型資料 (最多)
`gpt-4o-mini-audio-preview` (2024-12-17) GPT-4o 音訊	音訊和文字產生的音訊模型。	輸入：128,000 輸出：4,096	2023 年 10 月
`gpt-4o-mini-realtime-preview` (2024-12-17) GPT-4o 音訊	用於即時音訊處理的音訊模型。	輸入：128,000 輸出：4,096	2023 年 10 月
`gpt-4o-audio-preview` (2024-12-17) GPT-4o 音訊	音訊和文字產生的音訊模型。	輸入：128,000 輸出：4,096	2023 年 10 月
`gpt-4o-realtime-preview` (2024-12-17) GPT-4o 音訊	用於即時音訊處理的音訊模型。	輸入：128,000 輸出：4,096	2023 年 10 月
`gpt-4o-realtime-preview` (2024-10-01) GPT-4o 音訊	用於即時音訊處理的音訊模型。	輸入：128,000 輸出：4,096	2023 年 10 月

區域可用性

模型	區域
`gpt-4o-mini-audio-preview`	美國東部 2 （全球標準）
`gpt-4o-mini-realtime-preview`	美國東部 2 （全球標準）瑞典中部（全球標準）
`gpt-4o-audio-preview`	美國東部 2 （全球標準）瑞典中部（全球標準）
`gpt-4o-realtime-preview`	美國東部 2 （全球標準）瑞典中部（全球標準）

若要比較所有區域中 GPT-4o 音訊模型的可用性，請參閱 models 數據表。

GPT-4o 與 GPT-4 Turbo

GPT-4o 將文字和影像整合在單一模型中，使其能夠同時處理多個資料類型。這種多模態方法可增強人類與電腦互動的精準度和回應性。 GPT-4o 在英語文字和編碼工作時會與 GPT-4 Turbo 進行比對，同時在非英文語言和視覺工作中提供卓越的效能，為 AI 能力樹立新的基準。

如何存取 GPT-4o 和 GPT-4o 迷你模型？

GPT-4o 和 GPT-4o 迷你適用於標準和全域標準模型部署。

您必須在可用的模型所支援的標準或全域標準區域中建立 (部分機器翻譯) 或使用現有的資源。

建立資源後，您可以部署 GPT-4o 模型。如果您要執行程式設計部署，則模型名稱為：

gpt-4o 版本2024-11-20
gpt-4o 版本2024-08-06
gpt-4o 版本2024-05-13
gpt-4o-mini 版本2024-07-18

GPT-4 Turbo

GPT-4 Turbo 是大型多模態模型 (接受文字或影像輸入並產生文字)，可比 OpenAI 先前任何模型更精確地解決困難的問題。與 GPT-3.5 Turbo 一樣，舊版 GPT-4 模型和 GPT-4 Turbo 已針對聊天進行最佳化，且適用於傳統的完成工作。

GPT-4 Turbo 的最新 GA 版本為：

gpt-4 版本：turbo-2024-04-09

這是下列預覽模型的取代：

gpt-4 版本：1106-Preview
gpt-4 版本：0125-Preview
gpt-4 版本：vision-preview

OpenAI 與 Azure OpenAI GPT-4 Turbo GA 模型之間的差異

OpenAI 的最新 0409 turbo 模型版本支援所有推斷要求的 JSON 模式和函式呼叫。
Azure OpenAI 的最新 turbo-2024-04-09 版本目前不支援以影像 (視覺) 輸入進行推斷要求時使用 JSON 模式和函式呼叫。以文字為基礎的輸入要求 (沒有 image_url 和內嵌影像的要求) 支援 JSON 模式和函式呼叫。

GPT-4 視覺預覽的差異

Azure AI 特定的視覺增強功能與含有視覺功能的 GPT-4 Turbo 整合，不支援 gpt-4版本：turbo-2024-04-09。這包括光學字元辨識 (OCR)、物件基礎、影片提示，以及使用影像改善資料的處理。

重要

一旦將 gpt-4 版本: vision-preview 升級至 turbo-2024-04-09，則視覺增強預覽功能 (包括光學字元辨識 (OCR)、物件接地、影片提示) 即會淘汰且無法再使用。如果您目前依賴上述任何預覽功能，此自動模型升級將會是重大變更。

GPT-4 Turbo 佈建的受控可用性

gpt-4 版本：turbo-2024-04-09 可用於標準和佈建的部署。目前此模型的佈建版本不支援影像/視覺推斷要求。此模型的佈建部署只接受文字輸入。標準模型部署同時接受文字和影像/視覺推斷要求。

部署包含視覺功能的 GPT-4 Turbo GA

若要從 Azure AI Foundry 入口網站部署 GA 模型，請從下拉功能表中選取 GPT-4 並選擇 turbo-2024-04-09 版本。 gpt-4-turbo-2024-04-09 模型的預設配額會與 GPT-4-Turbo 目前的配額相同。請參閱區域配額限制。

GPT-4

GPT-4 是 GPT-4 Turbo 的前身。 GPT-4 和 GPT-4 Turbo 模型都有 gpt-4 的基本模型名稱。您可以檢查模型版本來區分 GPT-4 和 Turbo 模型。

gpt-4 版本0314
gpt-4 版本0613
gpt-4-32k 版本0613

您可以在模型摘要資料表中看到每個模型所支援的權杖內容長度。

GPT-4 和 GPT-4 Turbo 模型

這些模型只能與聊天完成 API 搭配使用。

請參閱模型版本，了解 Azure OpenAI 服務如何處理模型版本升級，以及使用模型了解如何檢視和設定 GPT-4 部署的模型版本設定。

Model ID	描述	要求上限 (權杖)	定型資料 (最多)
`gpt-4o` (2024-11-20) GPT-4o (Omni)	最新的大型 GA 模型 - 結構化輸出 - 文字、影像處理 - JSON 模式 - 平行函式呼叫 - 增強精確度和回應性 - 與具備視覺功能的 GPT-4 Turbo 在英語文字和編碼工作上的同等水平 - 在非英文語言和視覺工作中具有優越的效能。 - 增強創意寫作能力	輸入：128,000 輸出：16,384	2023 年 10 月
`gpt-4o` (2024-08-06) GPT-4o (Omni)	- 結構化輸出 - 文字、影像處理 - JSON 模式 - 平行函式呼叫 - 增強精確度和回應性 - 與具備視覺功能的 GPT-4 Turbo 在英語文字和編碼工作上的同等水平 - 在非英文語言和視覺工作中具有優越的效能	輸入：128,000 輸出：16,384	2023 年 10 月
`gpt-4o-mini` (2024-07-18) GPT-4o mini	最新的小型 GA 模型 - 快速、便宜、能夠取代 GPT-3.5 Turbo 系列模型的理想模型。 - 文字、影像處理 - JSON 模式 - 平行函式呼叫	輸入：128,000 輸出：16,384	2023 年 10 月
`gpt-4o` (2024-05-13) GPT-4o (Omni)	文字、影像處理 - JSON 模式 - 平行函式呼叫 - 增強精確度和回應性 - 與具備視覺功能的 GPT-4 Turbo 在英語文字和編碼工作上的同等水平 - 在非英文語言和視覺工作中具有優越的效能	輸入：128,000 輸出：4,096	2023 年 10 月
`gpt-4` (turbo-2024-04-09) 包含視覺功能的 GPT-4 Turbo	新的 GA 模型 - 取代所有先前的 GPT-4 預覽模型 (`vision-preview`、`1106-Preview`、`0125-Preview`)。 - 功能可用性目前會根據輸入方法和部署類型而有所不同。	輸入：128,000 輸出：4,096	2023 年 12 月
`gpt-4` (0125-Preview)* GPT-4 Turbo 預覽版	預覽模型 - 取代 1106-Preview - 更好的程式碼生成效能 - 減少模型未完成工作的狀況 - JSON 模式 - 平行函式呼叫 - 可重現的輸出 (預覽)	輸入：128,000 輸出：4,096	2023 年 12 月
`gpt-4` (vision-preview) 包含視覺功能的 GPT-4 Turbo 預覽版	預覽模型 - 接受文字和影像輸入。 - 支持增強功能 - JSON 模式 - 平行函式呼叫 - 可重現的輸出 (預覽)	輸入：128,000 輸出：4,096	2023 年 4 月
`gpt-4` (1106-Preview) GPT-4 Turbo 預覽版	預覽模型 - JSON 模式 - 平行函式呼叫 - 可重現的輸出 (預覽)	輸入：128,000 輸出：4,096	2023 年 4 月
`gpt-4-32k` (0613)	舊版 GA 模型 - 使用工具呼叫基本函式	32,768	2021 年 9 月
`gpt-4` (0613)	舊版 GA 模型 - 使用工具呼叫基本函式	8,192	2021 年 9 月
`gpt-4-32k`(0314)	舊版 GA 模型 - 淘汰資訊	32,768	2021 年 9 月
`gpt-4` (0314)	舊版 GA 模型 - 淘汰資訊	8,192	2021 年 9 月

警告

我們不建議在生產環境中使用預覽模型。我們將將預覽模型的所有部署升級至未來的預覽版本或最新的穩定 GA 版本。指定預覽的模型不會遵循標準的 Azure OpenAI 模型生命週期。

GPT-4 版本 0125-preview 是先前發行為 1106-preview 版 GPT-4 Turbo 預覽版的更新版本。
與 gpt-4-1106-preview 相比，GPT-4 版本 0125-preview 更完整地完成程式碼產生等工作。因此，根據工作的不同，客戶可能會發現 GPT-4-0125-preview 比 gpt-4-1106-preview 產生更多的輸出。我們建議客戶比較新模型的輸出。 GPT-4-0125-preview 也會解決 gpt-4-1106-preview 中針對非英文語言的 UTF-8 處理中的錯誤 (bug)。
GPT-4 版本 turbo-2024-04-09 是最新的 GA 版本，並會取代 0125-Preview、1106-preview 和 vision-preview。

GPT-3.5

GPT-3.5 模型可以了解並產生自然語言或程式碼。 GPT-3.5 系列中功能最強大且符合成本效益的模型是 GPT-3.5 Turbo，已針對聊天進行最佳化，也適用於傳統的完成工作。 GPT-3.5 Turbo 可與聊天完成 API 搭配使用。 GPT-3.5 Turbo Instruct 具有與使用完成 API 而非聊天完成 API 類似的功能 text-davinci-003。我們建議使用 GPT-3.5 Turbo 和 GPT-3.5 Turbo Instruct，而不是舊版 GPT-3.5 和 GPT-3 模型。

Model ID	描述	要求上限 (權杖)	定型資料 (最多)
`gpt-35-turbo` (0125) 新增	最新 GA 模型 - JSON 模式 - 平行函式呼叫 - 可重現的輸出 (預覽) - 以要求格式回應的精確度較高。 - 修正造成非英文語言函式呼叫文字編碼問題的 Bug。	輸入：16,385 輸出：4,096	2021 年 9 月
`gpt-35-turbo` (1106)	舊版 GA 模型 - JSON 模式 - 平行函式呼叫 - 可重現的輸出 (預覽)	輸入：16,385 輸出：4,096	2021 年 9 月
`gpt-35-turbo-instruct` (0914)	僅完成端點 - 取代舊版完成模型 (部分機器翻譯)	4,097	2021 年 9 月
`gpt-35-turbo-16k` (0613)	舊版 GA 模型 - 使用工具呼叫基本函式	16,384	2021 年 9 月
`gpt-35-turbo` (0613)	舊版 GA 模型 - 使用工具呼叫基本函式	4,096	2021 年 9 月
`gpt-35-turbo` ¹ (0301)	舊版 GA 模型 - 淘汰資訊	4,096	2021 年 9 月

若要深入了解如何與 GPT-3.5 Turbo 和聊天完成 API 進行互動，請參閱我們的深入操作說明。

¹ 此模型將接受 > 4,096 個權杖要求。不建議超過 4,096 個輸入權杖限制，因為較新版本的模型上限為 4,096 個權杖。如果使用此模型超過 4,096 個輸入權杖時遇到問題，則官方不支援此設定。

Embeddings

text-embedding-3-large 是最新且功能最強的內嵌模型。無法在內嵌模型之間進行升級。若要從使用 text-embedding-ada-002 移轉至 text-embedding-3-large，您必須產生新的內嵌。

text-embedding-3-large
text-embedding-3-small
text-embedding-ada-002

在測試中，OpenAI 報告顯示大型和小型第三代內嵌模型在 MIRACL 基準中提供了更好的平均多語言擷取效能，同時仍在 MTEB 基準中保持了英文工作的效能。

評估基準	`text-embedding-ada-002`	`text-embedding-3-small`	`text-embedding-3-large`
MIRACL 平均值	31.4	44.0	54.9
MTEB 平均值	61.0	62.3	64.6

第三代內嵌模型支援透過新的 dimensions 參數減少內嵌的大小。一般而言，從計算、記憶體和儲存體的觀點來看，較大的內嵌成本會更高。調整維度數目的功能可讓您更充分掌控整體成本和效能。 OpenAI 1.x Python 程式庫的所有版本都不支援 dimensions 參數，若要利用此參數，建議您升級至最新版本：pip install openai --upgrade。

OpenAI 的 MTEB 基準測試發現，即使第三代模型的維度減少到小於 text-embeddings-ada-002 1,536 個維度，效能還是稍微好一些。

DALL-E

DALL-E 模型會根據使用者提供的文字提示生成影像。 DALL-E 3 通常可搭配 REST API 使用。包含用戶端 SDK 的 DALL-E 2 和 DALL-E 3 處於預覽狀態。

Whisper

Whisper 模型可用於語音轉換文字。

您還可以透過 Azure AI 語音批次轉譯 API 使用 Whisper 模型。請參閱什麼是 Whisper 模型？深入了解何時使用 Azure AI 語音與Azure OpenAI 服務。

文字轉換語音 (預覽版)

OpenAI 文字轉換語音模型 (目前為預覽版) 可用於合成文字轉換語音。

您也可以透過 Azure AI 語音使用 OpenAI 文字轉換語音聲音。若要深入了解，請參閱透過 Azure OpenAI 服務或透過 Azure AI 語音實現 OpenAI 文字轉換語音聲音指南。

模型摘要資料表和區域可用性

依部署類型排序的模型

Azure OpenAI 可讓客戶選擇符合其商務和使用模式的裝載結構。此服務提供兩種主要部署類型：

標準提供全域部署選項，以全域路由傳送流量以提供更高的輸送量。
布建也提供全域部署選項，讓客戶可在 Azure 全域基礎結構之間購買和部署布建的輸送量單位。

所有部署都可以執行完全相同的推斷作業，但計費、規模和效能大不相同。若要深入瞭解 Azure OpenAI 部署類型，請參閱我們的部署類型指南。

全域標準模型可用性

區域	o3-mini， 2025-01-31	o1， 2024-12-17	o1-preview， 2024-09-12	o1-mini， 2024-09-12	gpt-4o，2024-05-13	gpt-4o，2024-08-06	gpt-4o， 2024-11-20	gpt-4o-mini, 2024-07-18	gpt-4o-realtime-preview， 2024-12-17	gpt-4o-realtime-preview， 2024-10-01	gpt-4o-audio-preview， 2024-12-17	gpt-4o-mini-realtime-preview， 2024-12-17	gpt-4o-mini-audio-preview， 2024-12-17	gpt-4，turbo-2024-04-09
australiaeast	-	-	-	-	✅	✅	-	✅	-	-	-	-	-	✅
brazilsouth	-	-	-	-	✅	✅	-	✅	-	-	-	-	-	✅
canadaeast	-	-	-	-	✅	✅	-	✅	-	-	-	-	-	✅
eastus	-	-	✅	✅	✅	✅	✅	✅	-	-	-	-	-	✅
eastus2	✅	✅	✅	✅	✅	✅	✅	✅	✅	✅	✅	✅	✅	✅
francecentral	-	-	-	-	✅	✅	-	✅	-	-	-	-	-	✅
germanywestcentral	-	-	-	-	✅	✅	-	✅	-	-	-	-	-	✅
japaneast	-	-	-	-	✅	✅	-	✅	-	-	-	-	-	✅
koreacentral	-	-	-	-	✅	✅	-	✅	-	-	-	-	-	✅
northcentralus	-	-	✅	✅	✅	✅	✅	✅	-	-	-	-	-	✅
norwayeast	-	-	-	-	✅	✅	-	✅	-	-	-	-	-	✅
polandcentral	-	-	-	-	✅	✅	-	✅	-	-	-	-	-	✅
southafricanorth	-	-	-	-	✅	✅	-	✅	-	-	-	-	-	✅
southcentralus	-	-	✅	✅	✅	✅	✅	✅	-	-	-	-	-	✅
southindia	-	-	-	-	✅	✅	-	✅	-	-	-	-	-	✅
spaincentral	-	-	-	-	✅	✅	-	✅	-	-	-	-	-	✅
swedencentral	✅	✅	✅	✅	✅	✅	✅	✅	✅	✅	✅	✅	-	✅
switzerlandnorth	-	-	-	-	✅	✅	-	✅	-	-	-	-	-	✅
uaenorth	-	-	-	-	✅	✅	-	✅	-	-	-	-	-	✅
uksouth	-	-	-	-	✅	✅	-	✅	-	-	-	-	-	✅
westeurope	-	-	-	-	✅	✅	-	✅	-	-	-	-	-	✅
westus	-	-	✅	✅	✅	✅	✅	✅	-	-	-	-	-	✅
westus3	-	-	✅	✅	✅	✅	✅	✅	-	-	-	-	-	✅

注意

大部分的 o 系列模型都是有限的存取。要求存取：有限的存取模型應用程式。 o1-mini 目前適用於所有客戶進行全域標準部署。

選取客戶已獲授與標準（地區）部署存取 o1-mini 權，作為有限存取版本的一部分 o1-preview 。目前，標準（區域）部署的存取 o1-mini 權並未擴大。

全域布建的受控模型可用性

區域	gpt-4o，2024-05-13	gpt-4o，2024-08-06	gpt-4o， 2024-11-20	gpt-4o-mini, 2024-07-18
australiaeast	✅	✅	✅	✅
brazilsouth	✅	✅	✅	✅
canadacentral	✅	✅	✅	✅
canadaeast	✅	✅	✅	✅
eastus	✅	✅	✅	✅
eastus2	✅	✅	✅	✅
francecentral	✅	✅	✅	✅
germanywestcentral	✅	✅	✅	✅
japaneast	✅	✅	✅	✅
koreacentral	✅	✅	✅	✅
northcentralus	✅	✅	✅	✅
norwayeast	✅	✅	✅	✅
polandcentral	✅	✅	✅	✅
southafricanorth	✅	✅	✅	✅
southcentralus	✅	✅	✅	✅
東南亞	✅	✅	✅	✅
southindia	✅	✅	✅	✅
swedencentral	✅	✅	✅	✅
switzerlandnorth	✅	✅	✅	✅
switzerlandwest	✅	✅	✅	✅
uaenorth	✅	✅	✅	✅
uksouth	✅	✅	✅	✅
westeurope	✅	✅	✅	✅
westus	✅	✅	✅	✅
westus3	✅	✅	✅	✅

全域批次模型可用性

區域	o3-mini， 2025-01-31	gpt-4o，2024-05-13	gpt-4o，2024-08-06	gpt-4o， 2024-11-20	gpt-4o-mini, 2024-07-18	gpt-4，0613	gpt-4，turbo-2024-04-09	gpt-35-turbo，0613	gpt-35-turbo，1106	gpt-35-turbo，0125
australiaeast	-	✅	✅	✅	✅	✅	✅	✅	✅	✅
brazilsouth	-	✅	✅	✅	✅	✅	✅	✅	✅	✅
canadaeast	-	✅	✅	✅	✅	✅	✅	✅	✅	✅
eastus	✅	✅	✅	✅	✅	✅	✅	✅	✅	✅
eastus2	✅	✅	✅	✅	✅	✅	✅	✅	✅	✅
francecentral	-	✅	✅	✅	✅	✅	✅	✅	✅	✅
germanywestcentral	-	✅	✅	✅	✅	✅	✅	✅	✅	✅
japaneast	-	✅	✅	✅	✅	✅	✅	✅	✅	✅
koreacentral	-	✅	✅	✅	✅	✅	✅	✅	✅	✅
northcentralus	-	✅	✅	✅	✅	✅	✅	✅	✅	✅
norwayeast	-	✅	✅	✅	✅	✅	✅	✅	✅	✅
polandcentral	-	✅	✅	✅	✅	✅	✅	✅	✅	✅
southafricanorth	-	✅	✅	✅	✅	✅	✅	✅	✅	✅
southcentralus	-	✅	✅	✅	✅	✅	✅	✅	✅	✅
southindia	-	✅	✅	✅	✅	✅	✅	✅	✅	✅
swedencentral	-	✅	✅	✅	✅	✅	✅	✅	✅	✅
switzerlandnorth	-	✅	✅	✅	✅	✅	✅	✅	✅	✅
uksouth	-	✅	✅	✅	✅	✅	✅	✅	✅	✅
westeurope	-	✅	✅	✅	✅	✅	✅	✅	✅	✅
westus	-	✅	✅	✅	✅	✅	✅	✅	✅	✅
westus3	✅	✅	✅	✅	✅	✅	✅	✅	✅	✅

數據區標準模型可用性

區域	o3-mini， 2025-01-31	gpt-4o，2024-05-13	gpt-4o，2024-08-06	gpt-4o-mini, 2024-07-18
eastus	✅	✅	✅	✅
eastus2	✅	✅	✅	✅
francecentral	-	✅	✅	✅
germanywestcentral	-	✅	✅	✅
northcentralus	✅	✅	✅	✅
polandcentral	-	✅	✅	✅
southcentralus	✅	✅	✅	✅
spaincentral	-	✅	✅	✅
swedencentral	-	✅	✅	✅
westeurope	-	✅	✅	✅
westus	✅	✅	✅	✅
westus3	✅	✅	✅	✅

注意

大部分的 o 系列模型都是有限的存取。要求存取：有限的存取模型應用程式。 o1-mini 目前適用於所有客戶進行全域標準部署。

選取客戶已獲授與標準（地區）部署存取 o1-mini 權，作為有限存取版本的一部分 o1-preview 。目前，標準（區域）部署的存取 o1-mini 權並未擴大。

數據區域布建的受控模型可用性

區域	gpt-4o，2024-05-13	gpt-4o，2024-08-06	gpt-4o-mini, 2024-07-18
eastus	✅	✅	✅
eastus2	✅	✅	✅
francecentral	✅	✅	✅
germanywestcentral	✅	✅	✅
northcentralus	✅	✅	✅
polandcentral	✅	✅	✅
southcentralus	✅	✅	✅
spaincentral	✅	✅	✅
swedencentral	✅	✅	✅
westeurope	✅	✅	✅
westus	✅	✅	✅
westus3	✅	✅	✅

數據區批次模型可用性

區域	o3-mini， 2025-01-31	gpt-4o，2024-08-06	gpt-4o-mini, 2024-07-18
eastus	✅	✅	✅
eastus2	✅	✅	✅
francecentral	-	✅	✅
germanywestcentral	-	✅	✅
northcentralus	✅	✅	✅
polandcentral	-	✅	✅
southcentralus	✅	✅	✅
swedencentral	-	✅	✅
westeurope	-	✅	✅
westus	✅	✅	✅
westus3	✅	✅	✅

標準部署模型可用性

區域	o1-preview， 2024-09-12	o1-mini， 2024-09-12	gpt-4o，2024-05-13	gpt-4o，2024-08-06	gpt-4o-mini, 2024-07-18	gpt-4，0613	gpt-4，1106-Preview	gpt-4，0125-Preview	gpt-4，vision-preview	gpt-4，turbo-2024-04-09	gpt-4-32k，0613	gpt-35-turbo，0301	gpt-35-turbo，0613	gpt-35-turbo，1106	gpt-35-turbo，0125	gpt-35-turbo-16k，0613	gpt-35-turbo-instruct，0914	text-embedding-3-small，1	text-embedding-3-large，1	text-embedding-ada-002，1	text-embedding-ada-002，2	dall-e-3，3.0	tts，001	tts-hd，001	whisper，001
australiaeast	-	-	-	-	-	✅	✅	-	✅	-	✅	-	✅	✅	✅	✅	-	✅	✅	-	✅	✅	-	-	-
brazilsouth	-	-	-	-	-	-	-	-	-	-	-	-	-	-	-	-	-	-	-	-	✅	-	-	-	-
canadaeast	-	-	-	-	-	✅	✅	-	-	-	✅	-	✅	✅	✅	✅	-	✅	✅	-	✅	-	-	-	-
eastus	✅	✅	✅	✅	✅	✅	-	✅	-	✅	-	✅	✅	-	✅	✅	✅	✅	✅	✅	✅	✅	-	-	-
eastus2	✅	✅	✅	✅	✅	✅	✅	-	-	✅	-	-	✅	-	✅	✅	-	✅	✅	-	✅	-	-	-	✅
francecentral	-	-	-	-	-	✅	✅	-	-	-	✅	✅	✅	✅	✅	✅	-	-	✅	-	✅	-	-	-	-
japaneast	-	-	-	-	-	-	-	-	✅	-	-	-	✅	-	✅	✅	-	✅	✅	-	✅	-	-	-	-
northcentralus	✅	✅	✅	✅	✅	✅	-	✅	-	✅	-	-	✅	-	✅	✅	-	-	-	-	✅	-	✅	✅	✅
norwayeast	-	-	-	-	-	-	✅	-	-	-	-	-	-	-	-	-	-	-	✅	-	✅	-	-	-	✅
polandcentral	-	-	-	-	-	-	-	-	-	-	-	-	-	-	-	-	-	-	✅	-	-	-	-	-	-
southafricanorth	-	-	-	-	-	-	-	-	-	-	-	-	-	-	-	-	-	-	-	-	✅	-	-	-	-
southcentralus	✅	✅	✅	✅	✅	-	-	✅	-	✅	-	✅	-	-	✅	-	-	-	-	✅	✅	-	-	-	-
southindia	-	-	-	-	-	-	✅	-	-	-	-	-	-	✅	✅	-	-	-	✅	-	✅	-	-	-	✅
swedencentral	✅	✅	✅	✅	✅	✅	✅	-	✅	✅	✅	-	✅	✅	✅	✅	✅	-	✅	-	✅	✅	✅	✅	✅
switzerlandnorth	-	-	-	-	-	✅	-	-	✅	-	✅	-	✅	-	✅	✅	-	✅	✅	-	✅	-	-	-	✅
uaenorth	-	-	-	-	-	-	-	-	-	-	-	-	-	-	-	-	-	-	✅	-	✅	-	-	-	✅
uksouth	-	-	-	-	-	-	✅	✅	-	-	-	✅	✅	✅	✅	✅	-	-	✅	-	✅	-	-	-	-
westeurope	-	-	-	-	-	-	-	-	-	-	-	✅	-	-	-	-	-	-	-	-	✅	-	-	-	✅
westus	✅	✅	✅	✅	✅	-	✅	-	✅	✅	-	-	-	✅	✅	-	-	✅	-	-	✅	-	-	-	-
westus3	✅	✅	✅	✅	✅	-	✅	-	-	✅	-	-	-	-	✅	-	-	-	✅	-	✅	-	-	-	-

注意

大部分的 o 系列模型都是有限的存取。要求存取：有限的存取模型應用程式。 o1-mini 目前適用於所有客戶進行全域標準部署。

選取客戶已獲授與標準（地區）部署存取 o1-mini 權，作為有限存取版本的一部分 o1-preview 。目前，標準（區域）部署的存取 o1-mini 權並未擴大。

佈建的部署模型可用性

區域	gpt-4o，2024-05-13	gpt-4o，2024-08-06	gpt-4o-mini, 2024-07-18	gpt-4，0613	gpt-4，1106-Preview	gpt-4，0125-Preview	gpt-4，turbo-2024-04-09	gpt-4-32k，0613	gpt-35-turbo，1106	gpt-35-turbo，0125
australiaeast	✅	✅	✅	✅	✅	✅	✅	✅	✅	✅
brazilsouth	✅	-	✅	✅	✅	✅	-	✅	✅	-
canadacentral	✅	-	-	✅	-	-	-	✅	-	✅
canadaeast	✅	✅	✅	✅	✅	-	✅	-	✅	-
eastus	✅	✅	✅	✅	✅	✅	✅	✅	✅	✅
eastus2	✅	✅	✅	✅	✅	✅	✅	✅	✅	✅
francecentral	✅	✅	✅	✅	✅	✅	-	✅	-	✅
germanywestcentral	✅	-	-	✅	✅	✅	✅	✅	✅	-
japaneast	✅	✅	✅	-	✅	✅	✅	-	-	✅
koreacentral	✅	✅	✅	✅	-	-	✅	✅	✅	-
northcentralus	✅	✅	✅	✅	✅	✅	✅	✅	✅	✅
norwayeast	✅	✅	✅	✅	-	✅	-	✅	-	-
polandcentral	✅	-	-	✅	✅	✅	✅	✅	✅	✅
southafricanorth	✅	-	-	✅	✅	-	✅	✅	✅	-
southcentralus	✅	✅	-	✅	✅	✅	✅	✅	✅	✅
東南亞	-	✅	✅	-	-	-	-	-	-	-
southindia	✅	✅	✅	✅	✅	✅	-	✅	✅	✅
swedencentral	✅	✅	✅	✅	✅	✅	✅	✅	✅	✅
switzerlandnorth	✅	✅	✅	✅	✅	✅	✅	✅	✅	✅
switzerlandwest	-	-	-	-	-	-	-	-	-	✅
uaenorth	✅	✅	-	-	✅	-	-	-	✅	✅
uksouth	✅	✅	✅	✅	✅	✅	✅	✅	✅	✅
westus	✅	✅	✅	✅	✅	✅	✅	✅	✅	✅
westus3	✅	✅	-	✅	✅	✅	✅	✅	✅	✅

注意

下列佈建版本 gpt-4版本：turbo-2024-04-09 目前僅限使用文字。

如需佈建部署的詳細資訊，請參閱我們的佈建指引 (部分機器翻譯)。

下表不包含微調區域可用性資訊。如需這項資訊，請參閱微調一節。

依端點的標準模型

聊天完成

區域	o1-preview， 2024-09-12	o1-mini， 2024-09-12	gpt-4o，2024-05-13	gpt-4o，2024-08-06	gpt-4o-mini, 2024-07-18	gpt-4，0613	gpt-4，1106-Preview	gpt-4，0125-Preview	gpt-4，vision-preview	gpt-4，turbo-2024-04-09	gpt-4-32k，0613	gpt-35-turbo，0301	gpt-35-turbo，0613	gpt-35-turbo，1106	gpt-35-turbo，0125	gpt-35-turbo-16k，0613
australiaeast	-	-	-	-	-	✅	✅	-	✅	-	✅	-	✅	✅	✅	✅
canadaeast	-	-	-	-	-	✅	✅	-	-	-	✅	-	✅	✅	✅	✅
eastus	✅	✅	✅	✅	✅	✅	-	✅	-	✅	-	✅	✅	-	✅	✅
eastus2	✅	✅	✅	✅	✅	✅	✅	-	-	✅	-	-	✅	-	✅	✅
francecentral	-	-	-	-	-	✅	✅	-	-	-	✅	✅	✅	✅	-	✅
japaneast	-	-	-	-	-	-	-	-	✅	-	-	-	✅	-	✅	✅
northcentralus	✅	✅	✅	✅	✅	✅	-	✅	-	✅	-	-	✅	-	✅	✅
norwayeast	-	-	-	-	-	-	✅	-	-	-	-	-	-	-	-	-
southcentralus	✅	✅	✅	✅	✅	-	-	✅	-	✅	-	✅	-	-	✅	-
southindia	-	-	-	-	-	-	✅	-	-	-	-	-	-	✅	✅	-
swedencentral	✅	✅	✅	✅	✅	✅	✅	-	✅	✅	✅	-	✅	✅	-	✅
switzerlandnorth	-	-	-	-	-	✅	-	-	✅	-	✅	-	✅	-	✅	✅
uksouth	-	-	-	-	-	-	✅	✅	-	-	-	✅	✅	✅	✅	✅
westeurope	-	-	-	-	-	-	-	-	-	-	-	✅	-	-	-	-
westus	✅	✅	✅	✅	✅	-	✅	-	✅	✅	-	-	-	✅	✅	-
westus3	✅	✅	✅	✅	✅	-	✅	-	-	✅	-	-	-	-	✅	-

注意

大部分的 o 系列模型都是有限的存取。要求存取：有限的存取模型應用程式。 o1-mini 目前適用於所有客戶進行全域標準部署。

選取客戶已獲授與標準（地區）部署存取 o1-mini 權，作為有限存取版本的一部分 o1-preview 。目前，標準（區域）部署的存取 o1-mini 權並未擴大。

GPT-4 和 GPT-4 Turbo 模型可用性

特定客戶存取權

除了上述可供所有 Azure OpenAI 客戶使用的區域之外，某些選取預先存在的客戶已獲授與其他區域中 GPT-4 版本的存取權：

模型	區域
`gpt-4` (0314) `gpt-4-32k` (0314)	美國東部法國中部美國中南部英國南部
`gpt-4` (0613) `gpt-4-32k` (0613)	美國東部美國東部 2 日本東部英國南部

GPT-3.5 模型

請參閱模型版本，了解 Azure OpenAI 服務如何處理模型版本升級，以及使用模型了解如何檢視和設定 GPT-3.5 Turbo 部署的模型版本設定。

內嵌模型

區域	text-embedding-3-small，1	text-embedding-3-large，1	text-embedding-ada-002，1	text-embedding-ada-002，2
australiaeast	✅	✅	-	✅
brazilsouth	-	-	-	✅
canadaeast	✅	✅	-	✅
eastus	✅	✅	✅	✅
eastus2	✅	✅	-	✅
francecentral	-	✅	-	✅
japaneast	✅	✅	-	✅
northcentralus	-	-	-	✅
norwayeast	-	✅	-	✅
polandcentral	-	✅	-	-
southafricanorth	-	-	-	✅
southcentralus	-	-	✅	✅
southindia	-	✅	-	✅
swedencentral	-	✅	-	✅
switzerlandnorth	✅	✅	-	✅
uaenorth	-	-	-	✅
uksouth	-	✅	-	✅
westeurope	-	-	-	✅
westus	✅	-	-	✅
westus3	-	✅	-	✅

這些模型只能與內嵌 API 要求搭配使用。

注意

Model ID	要求上限 (權杖)	輸出維度	訓練資料 (上限)
`text-embedding-ada-002` (版本 2)	8,192	1,536	2021 年 9 月
`text-embedding-ada-002` (版本 1)	2,046	1,536	2021 年 9 月
`text-embedding-3-large`	8,192	3,072	2021 年 9 月
`text-embedding-3-small`	8,192	1,536	2021 年 9 月

注意

傳送輸入陣列以進行內嵌時，每次呼叫內嵌端點時陣列中輸入項目的數目上限為 2048。

影像產生模型

區域	dall-e-3，3.0
australiaeast	✅
eastus	✅
swedencentral	✅

DALL-E 模型

Model ID	要求上限 (字元)
dall-e-3	4,000

音訊模型

區域	tts，001	tts-hd，001	whisper，001
eastus2	-	-	✅
northcentralus	✅	✅	✅
norwayeast	-	-	✅
southindia	-	-	✅
swedencentral	✅	✅	✅
switzerlandnorth	-	-	✅
uaenorth	-	-	✅
westeurope	-	-	✅

Whisper 模型

Model ID	要求上限 (音訊檔案大小)
`whisper`	25 MB

文字轉換語音模型 (預覽版)

Model ID	描述
`tts`	最新的 Azure OpenAI 文字到語音轉換模型，已針對速度優化。
`tts-hd`	最新的 Azure OpenAI 文字到語音轉換模型，已針對質量優化。

區域	gpt-35-turbo-instruct，0914
eastus	✅
swedencentral	✅

微調模型

注意

gpt-35-turbo - 微調此模型僅限於區域子集，而且無法在每個區域使用基底模型。

如果您在 Azure AI Foundry 專案中使用 Azure OpenAI 模型，而不是在專案外部使用 Azure OpenAI 模型，微調支援的區域可能會有所不同。

Model ID	微調區域	要求上限 (權杖)	定型資料 (最多)
`gpt-35-turbo` (0613)	美國東部 2 美國中北部瑞典中部瑞士西部	4,096	2021 年 9 月
`gpt-35-turbo` (1106)	美國東部 2 美國中北部瑞典中部瑞士西部	輸入：16,385 輸出：4,096	2021 年 9 月
`gpt-35-turbo` (0125)	美國東部 2 美國中北部瑞典中部瑞士西部	16,385	2021 年 9 月
`gpt-4` (0613) ¹	美國中北部瑞典中部	8192	2021 年 9 月
`gpt-4o-mini` (2024-07-18)	美國中北部瑞典中部	輸入：128,000 輸出：16,384 訓練範例內容長度：64,536	2023 年 10 月
`gpt-4o` (2024-08-06)	美國東部 2 美國中北部瑞典中部	輸入：128,000 輸出：16,384 訓練範例內容長度：64,536	2023 年 10 月

¹ GPT-4 目前處於公開預覽狀態。

助理 (預覽版)

對於助理，您需要支援的模型和支援的區域組合。某些工具和功能需要最新的模型。助理 API、SDK 和 Azure AI Foundry 中提供下列模型。下表適用於隨用隨付。如需佈建輸送量單位 (PTU) 可用性的相關資訊，請參閱佈建的輸送量 (部分機器翻譯)。列出的模型和區域可以與 Assistants v1 和 v2 搭配使用。如果下列區域支援，您可以使用全域標準模型。

區域	gpt-4o，2024-05-13	gpt-4o，2024-08-06	gpt-4o-mini, 2024-07-18	gpt-4，0613	gpt-4，1106-Preview	gpt-4，0125-Preview	gpt-4，turbo-2024-04-09	gpt-4-32k，0613	gpt-35-turbo，0613	gpt-35-turbo，1106	gpt-35-turbo，0125	gpt-35-turbo-16k，0613
australiaeast	-	-	-	✅	✅	-	-	✅	✅	✅	✅	✅
eastus	✅	✅	✅	-	-	✅	✅	-	✅	-	✅	✅
eastus2	✅	✅	✅	-	✅	-	✅	-	✅	-	✅	✅
francecentral	-	-	-	✅	✅	-	-	✅	✅	✅	-	✅
japaneast	-	-	-	-	-	-	-	-	✅	-	✅	✅
norwayeast	-	-	-	-	✅	-	-	-	-	-	-	-
southindia	-	-	-	-	✅	-	-	-	-	✅	✅	-
swedencentral	✅	✅	✅	✅	✅	-	✅	✅	✅	✅	-	✅
uksouth	-	-	-	-	✅	✅	-	-	✅	✅	✅	✅
westus	✅	✅	✅	-	✅	-	✅	-	-	✅	✅	-
westus3	✅	✅	✅	-	✅	-	✅	-	-	-	✅	-

模型淘汰

如需模型淘汰的最新資訊，請參閱模型淘汰指南。

共用方式為

Azure OpenAI 服務模型

o 系列模型

可用性

區域可用性

GPT-4o 音訊

區域可用性

GPT-4o 與 GPT-4 Turbo

如何存取 GPT-4o 和 GPT-4o 迷你模型？

GPT-4 Turbo

OpenAI 與 Azure OpenAI GPT-4 Turbo GA 模型之間的差異

GPT-4 視覺預覽的差異

GPT-4 Turbo 佈建的受控可用性

部署包含視覺功能的 GPT-4 Turbo GA

GPT-4

GPT-4 和 GPT-4 Turbo 模型

GPT-3.5

Embeddings

DALL-E

Whisper

文字轉換語音 (預覽版)

模型摘要資料表和區域可用性

依部署類型排序的模型

全域標準模型可用性

依端點的標準模型

聊天完成

GPT-4 和 GPT-4 Turbo 模型可用性

特定客戶存取權

GPT-3.5 模型

微調模型

助理 (預覽版)

模型淘汰

下一步

意見反應

其他資源