Azure OpenAI 服務模型
Azure OpenAI 服務是由一組具有不同功能和價格點的各種模型提供。 模型可用性會依區域和雲端而有所不同。 如需 Azure Government 模型可用性,請參閱 Azure Government OpenAI 服務。
模型 | 描述 |
---|---|
o1 和 o1-mini | 有限的存取模型,特別設計用來處理專注度和功能增加的推理和解決問題工作。 |
GPT-4o & GPT-4o 迷你 & GPT-4 Turbo | 最新且功能最強大的 Azure OpenAI 模型具有多模態版本,可同時接受文字和影像作為輸入。 |
GPT-4o-Realtime-Preview | GPT-4o 模型,支援低延遲的「語音輸入,語音輸出」交談互動。 |
GPT-4 | 一組在 GPT-3.5 上獲得改善的模型,可以了解及產生自然語言和程式碼。 |
GPT-3.5 | 一組在 GPT-3 上獲得改善的模型,可以了解及產生自然語言和程式碼。 |
內嵌 | 一組可將文字轉換成數值向量形式,以輔助文字相似性的模型。 |
DALL-E | 可從自然語言產生原始影像的一系列模型。 |
Whisper | 預覽版中的一系列模型,可將語音轉譯和翻譯為文字。 |
文字轉換語音 (預覽版) | 預覽版中的一系列模型,可以合成文字轉換語音。 |
o1 和 o1-mini 模型有限存取
Azure OpenAI o1
和 o1-mini
模型專為處理推理和問題解決工作而設計,具有更高的專注力和能力。 這些模型花費更多的時間處理和了解使用者的要求,這使得其在科學、程式碼撰寫和數學等領域比以前的迭代更加強大。
Model ID | 描述 | 要求上限 (權杖) | 定型資料 (最多) |
---|---|---|---|
o1 (2024-12-17) |
o1 系列中功能最強的模型,提供增強的推理能力。 要求存取: 有限的存取模型應用程式 - 結構化輸出 - 文字、影像處理 - 函式/工具 |
輸入:200,000 輸出:100,000 |
|
o1-preview (2024-09-12) |
舊版預覽版本 | 輸入:128,000 輸出:32,768 |
2023 年 10 月 |
o1-mini (2024-09-12) |
o1 系列中較快速且更具成本效益的選項,適用於需要速度和較低資源耗用量的編碼工作。 | 輸入:128,000 輸出:65,536 |
2023 年 10 月 |
可用性
和 o1
o1-mini
模型現在可供 API 存取和模型部署使用。 需要註冊,並根據Microsoft的資格準則來授與存取權。 先前已套用並收到 存取 o1-preview
權的客戶不需要重新套用,因為它們會自動在最新模型的等候清單上套用。
要求存取:有限存取模型應用程式 (英文)
授與存取權之後,您必須為每個模型建立部署。 如果您目前不支持現有的 o1-preview
部署升級,則必須建立新的部署。
若要深入瞭解進階 o1
數列模型, 請參閱開始使用 o1 系列推理模型。
區域可用性
模型 | 區域 |
---|---|
o1 |
美國東部 2 (全球標準) 瑞典中部(全球標準) |
o1-preview |
請參閱模型數據表。 |
o1-mini |
請參閱模型數據表。 |
GPT-4o-Realtime-Preview
此 gpt-4o-realtime-preview
模型是 GPT-4o 模型系列的一部分,並支援低延遲的「語音輸入,語音輸出」交談互動。 GPT-4o 音訊的設計訴求是處理即時、低延遲的對話互動,非常適合支援代理程式、助理、翻譯工具和其他需要使用者來回回應高回應的使用案例。
GPT-4o 音訊適用於美國東部 2 (eastus2
) 和瑞典中部 (swedencentral
) 區域。 若要使用 GPT-4o 音訊,您必須 在其中一個支援的區域中建立 或使用現有的資源。
建立資源時,您可以 部署 GPT-4o 音訊模型。 如果您要執行程式設計部署,則 模型 名稱為 gpt-4o-realtime-preview
。 如需如何使用 GPT-4o 音訊的詳細資訊,請參閱 GPT-4o 音訊檔。
下表提供最大要求令牌和定型數據的詳細數據。
Model ID | 描述 | 要求上限 (權杖) | 定型資料 (最多) |
---|---|---|---|
gpt-4o-realtime-preview (2024-10-01-preview) GPT-4o 音訊 |
即時音訊處理的音訊模型 | 輸入:128,000 輸出:4,096 |
2023 年 10 月 |
GPT-4o 與 GPT-4 Turbo
GPT-4o 將文字和影像整合在單一模型中,使其能夠同時處理多個資料類型。 這種多模態方法可增強人類與電腦互動的精準度和回應性。 GPT-4o 在英語文字和編碼工作時會與 GPT-4 Turbo 進行比對,同時在非英文語言和視覺工作中提供卓越的效能,為 AI 能力樹立新的基準。
如何存取 GPT-4o 和 GPT-4o 迷你模型?
GPT-4o 和 GPT-4o 迷你適用於標準和全域標準模型部署。
您必須在可用的模型所支援的標準或全域標準區域中建立 (部分機器翻譯) 或使用現有的資源。
建立資源後,您可以部署 GPT-4o 模型。 如果您要執行程式設計部署,則模型名稱為:
gpt-4o
版本2024-11-20
gpt-4o
版本2024-08-06
gpt-4o
版本2024-05-13
gpt-4o-mini
版本2024-07-18
GPT-4 Turbo
GPT-4 Turbo 是大型多模態模型 (接受文字或影像輸入並產生文字),可比 OpenAI 先前任何模型更精確地解決困難的問題。 與 GPT-3.5 Turbo 一樣,舊版 GPT-4 模型和 GPT-4 Turbo 已針對聊天進行最佳化,且適用於傳統的完成工作。
GPT-4 Turbo 的最新 GA 版本為:
gpt-4
版本:turbo-2024-04-09
這是下列預覽模型的取代:
gpt-4
版本:1106-Preview
gpt-4
版本:0125-Preview
gpt-4
版本:vision-preview
OpenAI 與 Azure OpenAI GPT-4 Turbo GA 模型之間的差異
- OpenAI 的最新
0409
turbo 模型版本支援所有推斷要求的 JSON 模式和函式呼叫。 - Azure OpenAI 的最新
turbo-2024-04-09
版本目前不支援以影像 (視覺) 輸入進行推斷要求時使用 JSON 模式和函式呼叫。 以文字為基礎的輸入要求 (沒有image_url
和內嵌影像的要求) 支援 JSON 模式和函式呼叫。
GPT-4 視覺預覽的差異
- Azure AI 特定的視覺增強功能與含有視覺功能的 GPT-4 Turbo 整合,不支援
gpt-4
版本:turbo-2024-04-09
。 這包括光學字元辨識 (OCR)、物件基礎、影片提示,以及使用影像改善資料的處理。
重要
一旦將 gpt-4
版本: vision-preview
升級至 turbo-2024-04-09
,則視覺增強預覽功能 (包括光學字元辨識 (OCR)、物件接地、影片提示) 即會淘汰且無法再使用。 如果您目前依賴上述任何預覽功能,此自動模型升級將會是重大變更。
GPT-4 Turbo 佈建的受控可用性
gpt-4
版本:turbo-2024-04-09
可用於標準和佈建的部署。 目前此模型的佈建版本不支援影像/視覺推斷要求。 此模型的佈建部署只接受文字輸入。 標準模型部署同時接受文字和影像/視覺推斷要求。
部署包含視覺功能的 GPT-4 Turbo GA
若要從 Azure AI Foundry 入口網站部署 GA 模型,請從下拉功能表中選取 GPT-4
並選擇 turbo-2024-04-09
版本。 gpt-4-turbo-2024-04-09
模型的預設配額會與 GPT-4-Turbo 目前的配額相同。 請參閱區域配額限制。
GPT-4
GPT-4 是 GPT-4 Turbo 的前身。 GPT-4 和 GPT-4 Turbo 模型都有 gpt-4
的基本模型名稱。 您可以檢查模型版本來區分 GPT-4 和 Turbo 模型。
gpt-4
版本0314
gpt-4
版本0613
gpt-4-32k
版本0613
您可以在模型摘要資料表中看到每個模型所支援的權杖內容長度。
GPT-4 和 GPT-4 Turbo 模型
- 這些模型只能與聊天完成 API 搭配使用。
請參閱模型版本,了解 Azure OpenAI 服務如何處理模型版本升級,以及使用模型了解如何檢視和設定 GPT-4 部署的模型版本設定。
Model ID | 描述 | 要求上限 (權杖) | 定型資料 (最多) |
---|---|---|---|
gpt-4o (2024-11-20) GPT-4o (Omni) |
最新的大型 GA 模型 - 結構化輸出 - 文字、影像處理 - JSON 模式 - 平行函式呼叫 - 增強精確度和回應性 - 與具備視覺功能的 GPT-4 Turbo 在英語文字和編碼工作上的同等水平 - 在非英文語言和視覺工作中具有優越的效能。 - 增強創意寫作能力 |
輸入:128,000 輸出:16,384 |
2023 年 10 月 |
gpt-4o (2024-08-06)GPT-4o (Omni) |
- 結構化輸出 - 文字、影像處理 - JSON 模式 - 平行函式呼叫 - 增強精確度和回應性 - 與具備視覺功能的 GPT-4 Turbo 在英語文字和編碼工作上的同等水平 - 在非英文語言和視覺工作中具有優越的效能 |
輸入:128,000 輸出:16,384 |
2023 年 10 月 |
gpt-4o-mini (2024-07-18)GPT-4o mini |
最新的小型 GA 模型 - 快速、便宜、能夠取代 GPT-3.5 Turbo 系列模型的理想模型。 - 文字、影像處理 - JSON 模式 - 平行函式呼叫 |
輸入:128,000 輸出:16,384 |
2023 年 10 月 |
gpt-4o (2024-05-13)GPT-4o (Omni) |
文字、影像處理 - JSON 模式 - 平行函式呼叫 - 增強精確度和回應性 - 與具備視覺功能的 GPT-4 Turbo 在英語文字和編碼工作上的同等水平 - 在非英文語言和視覺工作中具有優越的效能 |
輸入:128,000 輸出:4,096 |
2023 年 10 月 |
gpt-4 (turbo-2024-04-09)包含視覺功能的 GPT-4 Turbo |
新的 GA 模型 - 取代所有先前的 GPT-4 預覽模型 ( vision-preview 、1106-Preview 、0125-Preview )。 - 功能可用性目前會根據輸入方法和部署類型而有所不同。 |
輸入:128,000 輸出:4,096 |
2023 年 12 月 |
gpt-4 (0125-Preview)*GPT-4 Turbo 預覽版 |
預覽模型 - 取代 1106-Preview - 更好的程式碼生成效能 - 減少模型未完成工作的狀況 - JSON 模式 - 平行函式呼叫 - 可重現的輸出 (預覽) |
輸入:128,000 輸出:4,096 |
2023 年 12 月 |
gpt-4 (vision-preview)包含視覺功能的 GPT-4 Turbo 預覽版 |
預覽模型 - 接受文字和影像輸入。 - 支持增強功能 - JSON 模式 - 平行函式呼叫 - 可重現的輸出 (預覽) |
輸入:128,000 輸出:4,096 |
2023 年 4 月 |
gpt-4 (1106-Preview)GPT-4 Turbo 預覽版 |
預覽模型 - JSON 模式 - 平行函式呼叫 - 可重現的輸出 (預覽) |
輸入:128,000 輸出:4,096 |
2023 年 4 月 |
gpt-4-32k (0613) |
舊版 GA 模型 - 使用工具呼叫基本函式 |
32,768 | 2021 年 9 月 |
gpt-4 (0613) |
舊版 GA 模型 - 使用工具呼叫基本函式 |
8,192 | 2021 年 9 月 |
gpt-4-32k (0314) |
舊版 GA 模型 - 淘汰資訊 |
32,768 | 2021 年 9 月 |
gpt-4 (0314) |
舊版 GA 模型 - 淘汰資訊 |
8,192 | 2021 年 9 月 |
警告
我們不建議在生產環境中使用預覽模型。 我們將將預覽模型的所有部署升級至未來的預覽版本或最新的穩定 GA 版本。 指定的模型預覽版不遵循標準的 Azure OpenAI 模型生命週期。
- GPT-4 版本 0125-preview 是先前發行為 1106-preview 版 GPT-4 Turbo 預覽版的更新版本。
- 與 gpt-4-1106-preview 相比,GPT-4 版本 0125-preview 更完整地完成程式碼產生等工作。 因此,根據工作的不同,客戶可能會發現 GPT-4-0125-preview 比 gpt-4-1106-preview 產生更多的輸出。 我們建議客戶比較新模型的輸出。 GPT-4-0125-preview 也會解決 gpt-4-1106-preview 中針對非英文語言的 UTF-8 處理中的錯誤 (bug)。
- GPT-4 版本
turbo-2024-04-09
是最新的 GA 版本,並會取代0125-Preview
、1106-preview
和vision-preview
。
重要
GPT-4 (gpt-4
) 版本 1106-Preview
、 0125-Preview
和 vision-preview
將會在未來使用 穩定版本的 gpt-4
升級。
- 版本 、
0125-Preview
和vision-preview
的1106-Preview
gpt-4
部署會設定為 「自動更新為預設值」,而「到期時升級」將會在穩定版本發行後開始升級。 針對每個部署,模型版本升級不會中斷 API 呼叫服務。 升級會依區域暫存,且整個升級流程預期需要 2 週的時間。 gpt-4
版本1106-Preview
、0125-Preview
和vision-preview
的部署將不會升級為「無自動升級」,且會在區域中升級預覽版本時停止運作。 如需升級時間的詳細資訊,請參閱 Azure OpenAI 模型取代和淘汰。
GPT-3.5
GPT-3.5 模型可以了解並產生自然語言或程式碼。 GPT-3.5 系列中功能最強大且符合成本效益的模型是 GPT-3.5 Turbo,已針對聊天進行最佳化,也適用於傳統的完成工作。 GPT-3.5 Turbo 可與聊天完成 API 搭配使用。 GPT-3.5 Turbo Instruct 具有與使用完成 API 而非聊天完成 API 類似的功能 text-davinci-003
。 我們建議使用 GPT-3.5 Turbo 和 GPT-3.5 Turbo Instruct,而不是舊版 GPT-3.5 和 GPT-3 模型。
Model ID | 描述 | 要求上限 (權杖) | 定型資料 (最多) |
---|---|---|---|
gpt-35-turbo (0125) 新增 |
最新 GA 模型 - JSON 模式 - 平行函式呼叫 - 可重現的輸出 (預覽) - 以要求格式回應的精確度較高。 - 修正造成非英文語言函式呼叫文字編碼問題的 Bug。 |
輸入:16,385 輸出:4,096 |
2021 年 9 月 |
gpt-35-turbo (1106) |
舊版 GA 模型 - JSON 模式 - 平行函式呼叫 - 可重現的輸出 (預覽) |
輸入:16,385 輸出:4,096 |
2021 年 9 月 |
gpt-35-turbo-instruct (0914) |
僅完成端點 - 取代舊版完成模型 (部分機器翻譯) |
4,097 | 2021 年 9 月 |
gpt-35-turbo-16k (0613) |
舊版 GA 模型 - 使用工具呼叫基本函式 |
16,384 | 2021 年 9 月 |
gpt-35-turbo (0613) |
舊版 GA 模型 - 使用工具呼叫基本函式 |
4,096 | 2021 年 9 月 |
gpt-35-turbo 1 (0301) |
舊版 GA 模型 - 淘汰資訊 |
4,096 | 2021 年 9 月 |
若要深入了解如何與 GPT-3.5 Turbo 和聊天完成 API 進行互動,請參閱我們的深入操作說明。
1 此模型將接受 > 4,096 個權杖要求。 不建議超過 4,096 個輸入權杖限制,因為較新版本的模型上限為 4,096 個權杖。 如果使用此模型超過 4,096 個輸入權杖時遇到問題,則官方不支援此設定。
Embeddings
text-embedding-3-large
是最新且功能最強的內嵌模型。 無法在內嵌模型之間進行升級。 若要從使用 text-embedding-ada-002
移轉至 text-embedding-3-large
,您必須產生新的內嵌。
text-embedding-3-large
text-embedding-3-small
text-embedding-ada-002
在測試中,OpenAI 報告顯示大型和小型第三代內嵌模型在 MIRACL 基準中提供了更好的平均多語言擷取效能,同時仍在 MTEB 基準中保持了英文工作的效能。
評估基準 | text-embedding-ada-002 |
text-embedding-3-small |
text-embedding-3-large |
---|---|---|---|
MIRACL 平均值 | 31.4 | 44.0 | 54.9 |
MTEB 平均值 | 61.0 | 62.3 | 64.6 |
第三代內嵌模型支援透過新的 dimensions
參數減少內嵌的大小。 一般而言,從計算、記憶體和儲存體的觀點來看,較大的內嵌成本會更高。 調整維度數目的功能可讓您更充分掌控整體成本和效能。 OpenAI 1.x Python 程式庫的所有版本都不支援 dimensions
參數,若要利用此參數,建議您升級至最新版本:pip install openai --upgrade
。
OpenAI 的 MTEB 基準測試發現,即使第三代模型的維度減少到小於 text-embeddings-ada-002
1,536 個維度,效能還是稍微好一些。
DALL-E
DALL-E 模型會根據使用者提供的文字提示生成影像。 DALL-E 3 通常可搭配 REST API 使用。 包含用戶端 SDK 的 DALL-E 2 和 DALL-E 3 處於預覽狀態。
Whisper
Whisper 模型可用於語音轉換文字。
您還可以透過 Azure AI 語音批次轉譯 API 使用 Whisper 模型。 請參閱什麼是 Whisper 模型?深入了解何時使用 Azure AI 語音與Azure OpenAI 服務。
文字轉換語音 (預覽版)
OpenAI 文字轉換語音模型 (目前為預覽版) 可用於合成文字轉換語音。
您也可以透過 Azure AI 語音使用 OpenAI 文字轉換語音聲音。 若要深入了解,請參閱透過 Azure OpenAI 服務或透過 Azure AI 語音實現 OpenAI 文字轉換語音聲音指南。
模型摘要資料表和區域可用性
依部署類型排序的模型
Azure OpenAI 可讓客戶選擇符合其商務和使用模式的裝載結構。 此服務提供兩種主要部署類型:
- 標準 提供全域部署選項,以全域路由傳送流量以提供更高的輸送量。
- 布建 也提供全域部署選項,讓客戶可在 Azure 全域基礎結構之間購買和部署布建的輸送量單位。
所有部署都可以執行完全相同的推斷作業,但計費、規模和效能大不相同。 若要深入瞭解 Azure OpenAI 部署類型,請參閱我們的 部署類型指南。
全域標準模型可用性
區域 | o1-preview, 2024-09-12 | o1-mini, 2024-09-12 | gpt-4o,2024-05-13 | gpt-4o,2024-08-06 | gpt-4o, 2024-11-20 | gpt-4o-mini, 2024-07-18 | gpt-4o-realtime-preview, 2024-10-01 | gpt-4,turbo-2024-04-09 |
---|---|---|---|---|---|---|---|---|
australiaeast | - | - | ✅ | ✅ | - | ✅ | - | ✅ |
brazilsouth | - | - | ✅ | ✅ | - | ✅ | - | ✅ |
canadaeast | - | - | ✅ | ✅ | - | ✅ | - | ✅ |
eastus | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | - | ✅ |
eastus2 | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ |
francecentral | - | - | ✅ | ✅ | - | ✅ | - | ✅ |
germanywestcentral | - | - | ✅ | ✅ | - | ✅ | - | ✅ |
japaneast | - | - | ✅ | ✅ | - | ✅ | - | ✅ |
koreacentral | - | - | ✅ | ✅ | - | ✅ | - | ✅ |
northcentralus | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | - | ✅ |
norwayeast | - | - | ✅ | ✅ | - | ✅ | - | ✅ |
polandcentral | - | - | ✅ | ✅ | - | ✅ | - | ✅ |
southafricanorth | - | - | ✅ | ✅ | - | ✅ | - | ✅ |
southcentralus | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | - | ✅ |
southindia | - | - | ✅ | ✅ | - | ✅ | - | ✅ |
spaincentral | - | - | ✅ | ✅ | - | ✅ | - | ✅ |
swedencentral | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ |
switzerlandnorth | - | - | ✅ | ✅ | - | ✅ | - | ✅ |
uaenorth | - | - | ✅ | ✅ | - | ✅ | - | ✅ |
uksouth | - | - | ✅ | ✅ | - | ✅ | - | ✅ |
westeurope | - | - | ✅ | ✅ | - | ✅ | - | ✅ |
westus | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | - | ✅ |
westus3 | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | - | ✅ |
下表不包含微調區域可用性資訊。 如需這項資訊, 請參閱微調一節 。
依端點的標準模型
聊天完成
區域 | o1-preview, 2024-09-12 | o1-mini, 2024-09-12 | gpt-4o,2024-05-13 | gpt-4o,2024-08-06 | gpt-4o-mini, 2024-07-18 | gpt-4,0613 | gpt-4,1106-Preview | gpt-4,0125-Preview | gpt-4,vision-preview | gpt-4,turbo-2024-04-09 | gpt-4-32k,0613 | gpt-35-turbo,0301 | gpt-35-turbo,0613 | gpt-35-turbo,1106 | gpt-35-turbo,0125 | gpt-35-turbo-16k,0613 |
---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|
australiaeast | - | - | - | - | - | ✅ | ✅ | - | ✅ | - | ✅ | - | ✅ | ✅ | ✅ | ✅ |
canadaeast | - | - | - | - | - | ✅ | ✅ | - | - | - | ✅ | - | ✅ | ✅ | ✅ | ✅ |
eastus | ✅ | ✅ | ✅ | ✅ | ✅ | - | - | ✅ | - | ✅ | - | ✅ | ✅ | - | ✅ | ✅ |
eastus2 | ✅ | ✅ | ✅ | ✅ | ✅ | - | ✅ | - | - | ✅ | - | - | ✅ | - | ✅ | ✅ |
francecentral | - | - | - | - | - | ✅ | ✅ | - | - | - | ✅ | ✅ | ✅ | ✅ | - | ✅ |
japaneast | - | - | - | - | - | - | - | - | ✅ | - | - | - | ✅ | - | ✅ | ✅ |
northcentralus | ✅ | ✅ | ✅ | ✅ | ✅ | - | - | ✅ | - | ✅ | - | - | ✅ | - | ✅ | ✅ |
norwayeast | - | - | - | - | - | - | ✅ | - | - | - | - | - | - | - | - | - |
southcentralus | ✅ | ✅ | ✅ | ✅ | ✅ | - | - | ✅ | - | ✅ | - | ✅ | - | - | ✅ | - |
southindia | - | - | - | - | - | - | ✅ | - | - | - | - | - | - | ✅ | ✅ | - |
swedencentral | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | - | ✅ | ✅ | ✅ | - | ✅ | ✅ | - | ✅ |
switzerlandnorth | - | - | - | - | - | ✅ | - | - | ✅ | - | ✅ | - | ✅ | - | ✅ | ✅ |
uksouth | - | - | - | - | - | - | ✅ | ✅ | - | - | - | ✅ | ✅ | ✅ | ✅ | ✅ |
westeurope | - | - | - | - | - | - | - | - | - | - | - | ✅ | - | - | - | - |
westus | ✅ | ✅ | ✅ | ✅ | ✅ | - | ✅ | - | ✅ | ✅ | - | - | - | ✅ | ✅ | - |
westus3 | ✅ | ✅ | ✅ | ✅ | ✅ | - | ✅ | - | - | ✅ | - | - | - | - | ✅ | - |
GPT-4 和 GPT-4 Turbo 模型可用性
特定客戶存取權
除了上述可供所有 Azure OpenAI 客戶使用的區域之外,某些特定的現有客戶具有其他區域 GPT-4 版本的存取權:
模型 | 區域 |
---|---|
gpt-4 (0314)gpt-4-32k (0314) |
美國東部 法國中部 美國中南部 英國南部 |
gpt-4 (0613)gpt-4-32k (0613) |
美國東部 美國東部 2 日本東部 英國南部 |
GPT-3.5 模型
請參閱模型版本,了解 Azure OpenAI 服務如何處理模型版本升級,以及使用模型了解如何檢視和設定 GPT-3.5 Turbo 部署的模型版本設定。
微調模型
注意
gpt-35-turbo
- 微調此模型僅限於區域子集,而且無法在每個區域使用基底模型。
如果您在 Azure AI Foundry 專案中使用 Azure OpenAI 模型,而不是在專案外部使用 Azure OpenAI 模型,微調支援的區域可能會有所不同。
Model ID | 微調區域 | 要求上限 (權杖) | 訓練資料 (上限) |
---|---|---|---|
babbage-002 |
美國中北部 瑞典中部 瑞士西部 |
16,384 | 2021 年 9 月 |
davinci-002 |
美國中北部 瑞典中部 瑞士西部 |
16,384 | 2021 年 9 月 |
gpt-35-turbo (0613) |
美國東部 2 美國中北部 瑞典中部 瑞士西部 |
4,096 | 2021 年 9 月 |
gpt-35-turbo (1106) |
美國東部 2 美國中北部 瑞典中部 瑞士西部 |
輸入:16,385 輸出:4,096 |
2021 年 9 月 |
gpt-35-turbo (0125) |
美國東部 2 美國中北部 瑞典中部 瑞士西部 |
16,385 | 2021 年 9 月 |
gpt-4 (0613) 1 |
美國中北部 瑞典中部 |
8192 | 2021 年 9 月 |
gpt-4o-mini (2024-07-18) |
美國中北部 瑞典中部 |
輸入:128,000 輸出:16,384 訓練範例內容長度:64,536 |
2023 年 10 月 |
gpt-4o (2024-08-06) |
美國東部 2 美國中北部 瑞典中部 |
輸入:128,000 輸出:16,384 訓練範例內容長度:64,536 |
2023 年 10 月 |
1 GPT-4 目前處於公開預覽狀態。
助理 (預覽版)
對於助理,您需要支援的模型和支援的區域組合。 某些工具和功能需要最新的模型。 助理 API、SDK 和 Azure AI Foundry 中提供下列模型。 下表適用於隨用隨付。 如需佈建輸送量單位 (PTU) 可用性的相關資訊,請參閱佈建的輸送量 (部分機器翻譯)。 列出的模型和區域可以與 Assistants v1 和 v2 搭配使用。 如果下列區域支援,您可以使用全域標準模型。
區域 | gpt-35-turbo (0613) |
gpt-35-turbo (1106) |
fine tuned gpt-3.5-turbo-0125 |
gpt-4 (0613) |
gpt-4 (1106) |
gpt-4 (0125) |
gpt-4o (2024-05-13) |
gpt-4o-mini (2024-07-18) |
---|---|---|---|---|---|---|---|---|
澳大利亞東部 | ✅ | ✅ | ✅ | ✅ | ||||
美國東部 | ✅ | ✅ | ✅ | ✅ | ||||
美國東部 2 | ✅ | ✅ | ✅ | ✅ | ✅ | |||
法國中部 | ✅ | ✅ | ✅ | ✅ | ||||
日本東部 | ✅ | |||||||
挪威東部 | ✅ | |||||||
瑞典中部 | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | ||
英國南部 | ✅ | ✅ | ✅ | ✅ | ||||
美國西部 | ✅ | ✅ | ✅ | |||||
美國西部 3 | ✅ | ✅ |
模型淘汰
如需模型淘汰的最新資訊,請參閱模型淘汰指南。