Azure OpenAI 服務的新功能
本文提供 Azure OpenAI 的最新版本和主要文件更新摘要。
2025 年 1 月
GPT-4o 即時 API 2024-12-17
gpt-4o-realtime-preview
模型版本 2024-12-17 適用於美國東部 2 和瑞典中部地區的全域部署。 gpt-4o-realtime-preview
使用版本 2024-12-17 模型,而不是 gpt-4o-realtime-preview
2024-10-01-preview 版本來進行即時音頻互動。
- 已新增對
gpt-4o-realtime-preview
模型提示快取的支援。 - 已新增對新語音的支援。 模型
gpt-4o-realtime-preview
現在支援下列聲音:「合金」、「灰」、「民謠」、「珊瑚」、」回聲“、”聖人“、”閃閃“、”詩句“。 - 速率限制不再以每分鐘連線為基礎。 速率限制現在是以模型的 RPM(每分鐘要求)和 TPM(每分鐘令牌)
gpt-4o-realtime-preview
為基礎。 每個gpt-4o-realtime-preview
模型部署的速率限製為100K TPM和1K RPM。 在預覽期間,Azure AI Foundry 入口網站和 API 可能會不正確顯示不同的速率限制。 即使您嘗試設定不同的速率限制,實際速率限制也會是 100K TPM 和 1K RPM。
如需詳細資訊,請參閱 GPT-4o 即時音訊快速入門 和 操作指南。
2024 年 12 月
針對有限存取發行的 o1 推理模型
最新的 o1
模型現在可供 API 存取和模型部署使用。 需要註冊,並根據Microsoft的資格準則來授與存取權。 先前已套用並收到 存取 o1-preview
權的客戶不需要重新套用,因為它們會自動在最新模型的等候清單上套用。
要求存取:有限存取模型應用程式 (英文)
若要深入瞭解進階 o1
數列模型, 請參閱開始使用 o1 系列推理模型。
區域可用性
模型 | 區域 |
---|---|
o1 (版本:2024-12-17) |
美國東部 2 (全球標準) 瑞典中部(全球標準) |
喜好設定微調 (預覽)
直接喜好設定優化 (DPO) 是大型語言模型的新對齊技術,旨在根據人類喜好設定來調整模型權數。 不同於人類意見反應的增強式學習(RLHF),DPO 不需要調整獎勵模型,並使用更簡單的數據(二進位喜好設定)進行定型。 此方法在計算上較輕且更快,因此在對齊時同樣有效,同時更有效率。 DPO 在語氣、樣式或特定內容喜好設定等主觀元素很重要的案例中特別有用。 我們很高興從模型開始 gpt-4o-2024-08-06
,在 Azure OpenAI 服務中宣佈 DPO 的公開預覽。
如需微調模型區域可用性,請參閱 模型頁面。
預存完成和釀酒
預存完成可讓您從聊天完成會話擷取交談歷程記錄,以作為評估和微調的數據集。
GPT-4o 2024-11-20
- 美國東部
- 美國東部 2
- 美國中北部
- 美國中南部
- 美國西部
- 美國西部 3
- 瑞典中部
新的數據區布建部署類型
數據區布建部署可在與所有其他 Azure OpenAI 部署類型相同的 Azure OpenAI 資源中使用,但可讓您利用 Azure 全域基礎結構,以動態方式將流量路由傳送至Microsoft定義數據區內的數據中心,並針對每個要求提供最佳可用性。 數據區布建的部署會使用Microsoft指定數據區域內的 Azure 基礎結構,提供高且可預測的輸送量保留模型處理容量。 、 gpt-4o-2024-05-13
和 gpt-4o-mini-2024-07-18
模型支援gpt-4o-2024-08-06
數據區域布建部署。
如需詳細資訊,請參閱部署類型指南。
2024 年 11 月
視覺微調 GA
目前正式推出(GA)的GPT-4o(2024-08-06)的視覺微調。
視覺微調 可讓您將影像新增至 JSONL 定型數據。 就像您可以將一或多個影像輸入傳送至聊天完成一樣,您可以在定型數據中包含這些相同的訊息類型。 您可以將影像提供為 URL 或 base64 編碼影像。
如需微調模型區域可用性,請參閱 模型頁面。
新的 AI 濫用監視
我們引進了新的濫用監視形式,利用 LLM 來提升偵測可能濫用 Azure OpenAI 服務的效率,並啟用濫用監視,而不需要人為檢閱提示和完成。 深入瞭解,請參閱 濫用監視。
透過內容分類和/或識別為可能濫用使用模式的提示和完成,會受到額外的檢閱程式,以協助確認系統的分析和通知動作決策。 我們的濫用監視系統已經擴展,以在必要時和適當時啟用 LLM 的審查。
2024 年 10 月
新的數據區標準部署類型
數據區標準部署可在與所有其他 Azure OpenAI 部署類型相同的 Azure OpenAI 資源中使用,但可讓您利用 Azure 全域基礎結構,以動態方式將流量路由傳送至Microsoft定義之數據區域內的數據中心,並針對每個要求提供最佳可用性。 數據區標準提供比 Azure 地理位置型部署類型更高的預設配額。 、 gpt-4o-2024-05-13
和 gpt-4o-mini-2024-07-18
模型支援gpt-4o-2024-08-06
數據區域標準部署。
如需詳細資訊,請參閱部署類型指南。
全域 Batch GA
Azure OpenAI 全域批次現已正式推出。
Azure OpenAI Batch API 的設計目的是要有效率地處理大規模和大量處理工作。 以個別配額處理要求的非同步群組 (目標往返時間為 24 小時),且成本比全域標準低 50%。 使用批次處理時,不是一次傳送一個要求,而是在單一檔案中傳送大量要求。 全域批次要求有個別加入佇列的權杖配額,可避免任何線上工作負載中斷。
關鍵使用案例包括:
大規模資料處理:以平行方式快速分析廣泛的資料集。
內容產生:建立大量文字,例如產品描述或文章。
文件檢閱和摘要:自動檢閱和摘要冗長文件。
客戶支援自動化:同時處理許多查詢,以更快做出回應。
資料擷取和分析:從大量的非結構化資料擷取和分析資訊。
自然語言處理 (NLP) 工作:在大型資料集上執行情感分析或翻譯等工作。
行銷與個人化:大規模產生個人化內容和建議。
取得開始使用全域批次部署的詳細資訊。
o1-preview 和 o1-mini 模型有限存取
和 o1-preview
o1-mini
模型現在可供 API 存取和模型部署使用。 需要註冊,並根據Microsoft的資格準則來授與存取權。
要求存取:有限存取模型應用程式 (英文)
已核准且可透過早期存取遊樂場存取模型的客戶不需要再次套用,系統會自動獲得 API 存取權。 一旦授與存取權,您必須為每個模型建立部署。
API 支援:
API 版本2024-09-01-preview
已新增 o1 系列模型的支援。
參數 max_tokens
已被取代,並取代為新的 max_completion_tokens
參數。 o1 系列 模型只能與 參數搭配使用 max_completion_tokens
。
區域可用性:
模型適用於美國東部 2 和瑞典中部的標準和全域標準部署,以供已核准的客戶使用。
適用於語音和音訊公開預覽的新 GPT-4o 即時 API
Azure OpenAI GPT-4o 音訊是 GPT-4o 模型系列的一部分,可支援低延遲、「語音輸入、語音輸出」交談互動。 GPT-4o 音訊 realtime
API 旨在處理即時、低延遲的對話互動,因此非常適合使用者與模型之間即時互動的使用案例,例如客戶支援專員、語音助理和實時翻譯工具。
此gpt-4o-realtime-preview
模型適用於美國東部 2 和瑞典中部地區的全域部署。
如需詳細資訊,請參閱 GPT-4o 即時音訊快速入門。
全域批次支援更新
全域批次現在支援 GPT-4o (2024-08-06)。 如需詳細資訊, 請參閱全域批次入門指南 。
2024 年 9 月
Azure OpenAI Studio UX 更新
自 2024 年 9 月 19 日起,當您移至 Azure OpenAI Studio 時,預設不會再看到舊版 Azure OpenAI Studio。 在未來幾週內,如有需要,您仍可使用 UI 頂端工具列中的 [切換至舊外觀] 切換來回到舊版的體驗。 如果您切換回舊版 Azure AI Foundry 入口網站,如果您填寫意見反應窗體以讓我們知道原因,則很有説明。 我們正積極監視此意見反應,以改善新體驗。
GPT-4o 2024-08-06 佈建的部署
GPT-4o 2024-08-06 現在可在美國東部、美國東部 2、美國中北部和瑞典中部供佈建部署使用。 它也可用於全域布建的部署。
如需模型可用性的最新資訊,請參閱模型頁面。
「新的」全域佈建部署類型
全域部署可在與非全域部署類型相同的 Azure OpenAI 資源中使用,但可讓您利用 Azure 的全域基礎結構,以動態方式將流量路由傳送至資料中心,並針對每個要求提供最佳可用性。 全域佈建的部署會使用 Azure 全域基礎結構,為可預測的高輸送量提供保留的模型處理容量。 gpt-4o-2024-08-06
和 gpt-4o-mini-2024-07-18
模型支援全域佈建的部署。
如需詳細資訊,請參閱部署類型指南。
新的 o1-preview 和 o1-mini 模型可供有限存取
Azure OpenAI o1-preview
和 o1-mini
模型的設計目的是要以更高的焦點和功能處理推理和解決問題的工作。 這些模型花費更多的時間處理和了解使用者的要求,這使得其在科學、程式碼撰寫和數學等領域比以前的迭代更加強大。
o1 系列的重要功能
- 複雜程式碼產生:能夠產生演算法,並處理進階程式碼撰寫工作以支援開發人員。
- 進階問題解決:非常適合全面腦力激盪的研討會,並解決多方面的挑戰。
- 複雜文件比較:非常適合分析合約、案件卷宗或法律文件以識別細微差別。
- 遵循指示和工作流程管理:對於管理需要較短內容的工作流程特別有效。
模型變體
o1-preview
:o1-preview
是o1
系列模型中能力更強的模型。o1-mini
:o1-mini
是o1
系列模型中更快且更便宜的模型。
模型版本:2024-09-12
要求存取:有限存取模型應用程式 (英文)
限制
數位 o1
模型目前處於預覽狀態,且不包含其他模型中可用的一些功能,例如影像理解和結構化輸出,這些輸出可在最新的 GPT-4o 模型中取得。 對於許多工作,一般可用的 GPT-4o 模型可能仍然更合適。
安全性
OpenAI 已將額外的安全措施納入 o1
模型,包括協助模型拒絕不安全要求的新技術。 這些進步使得 o1
系列成為一些最強固的模型之一。
可用性
和 o1-preview
o1-mini
可在美國東部 2 區域中透過 Azure AI Foundry 入口網站早期存取遊樂場進行有限存取。 模型的數據處理 o1
可能會發生在與可供使用的區域不同。
若要在搶先存取遊樂場中嘗試 o1-preview
和 o1-mini
模型,需要 註冊,並將根據 Microsoft 的資格準則來授與存取權。
要求存取:有限存取模型應用程式 (英文)
一旦授與了存取權,您就需要:
- 瀏覽至 https://ai.azure.com/resources,然後選取
eastus2
區域中的資源。 如果您沒有此區域中的 Azure OpenAI 資源,則必須 建立一個資源。 - 一旦選取了
eastus2
Azure OpenAI 資源,請在左上方面板中的 [遊樂場] 下,選取 [搶先存取遊樂場 (預覽版)]。
2024 年 8 月
GPT-4o 2024-08-06 結構化輸出
- 可在所有美國區域和瑞典中部進行標準和全球部署。
- 此模型新增了對結構化輸出 (英文) 的支援。
GPT-4o mini 佈建部署
GPT-4o mini 現在可在加拿大東部、美國東部、美國東部、美國東部 2、美國中北部和瑞典中部供佈建部署使用。
如需模型可用性的最新資訊,請參閱模型頁面。
GPT-4o 微調 (公開預覽)
GPT-4o 微調現在可在美國中北部和瑞典中部以公開預覽版形式供 Azure OpenAI 使用。
如需詳細資訊,請參閱我們的部落格文章。
新的預覽 API 版本
API 版本 2024-07-01-preview
是最新的資料平面製作和推斷 API 版本。 它會取代 API 版本 2024-05-01-preview
,並新增以下的支援:
- 已新增批次 API 支援
- 向量存放區區塊化策略參數
max_num_results
檔案搜尋工具應該輸出。
如需詳細資訊,請參閱參考文件
GPT-4o mini 區域可用性
- GPT-4o mini 現在可在美國東部和瑞典中部區域供標準部署和全域標準部署使用。
- GPT-4o mini 現在可在美國東部、瑞典中部和美國西部區域供全域批次部署使用。
評估指南
早期存取遊樂場中提供的最新 GPT-4o 模型 (預覽)
2024 年 8 月 6 日,OpenAI 宣佈最新版本的旗艦 GPT-4o 模型版本 2024-08-06
。 GPT-4o 2024-08-06
具有舊版的所有功能,以及:
- 增強支援複雜結構化輸出的能力。
- 輸出權杖上限已從 4,096 增加到 16,384。
Azure 客戶可以在新的 Azure AI Foundry 早期存取遊樂場中測試 GPT-4o 2024-08-06
(預覽版)。
不同於先前的早期存取遊樂場,Azure AI Foundry 入口網站早期存取遊樂場(預覽版)不需要您在特定區域中擁有資源。
注意
在任何 Azure OpenAI 區域中,都可能會處理透過早期存取遊樂場進行的提示和完成,而且目前每個 Azure 訂用帳戶限制每分鐘會要求 10 個。 此限制可能會在未來變更。
即使已核准進行修改,仍會為所有搶先試用遊樂場使用者啟用 Azure OpenAI 服務濫用監視功能;已啟用預設內容篩選且無法修改。
若要測試 GPT-4o 2024-08-06
,請使用此連結登入 Azure AI 早期存取遊樂場 (預覽版)。
全域批次部署現已推出
Azure OpenAI 批次 API 的設計目的是要有效率地處理大規模和大量處理工作。 以個別配額處理要求的非同步群組 (目標往返時間為 24 小時),且成本比全域標準低 50%。 使用批次處理時,不是一次傳送一個要求,而是在單一檔案中傳送大量要求。 全域批次要求有個別加入佇列的權杖配額,可避免任何線上工作負載中斷。
關鍵使用案例包括:
大規模資料處理:以平行方式快速分析廣泛的資料集。
內容產生:建立大量文字,例如產品描述或文章。
文件檢閱和摘要:自動檢閱和摘要冗長文件。
客戶支援自動化:同時處理許多查詢,以更快做出回應。
資料擷取和分析:從大量的非結構化資料擷取和分析資訊。
自然語言處理 (NLP) 工作:在大型資料集上執行情感分析或翻譯等工作。
行銷與個人化:大規模產生個人化內容和建議。
取得開始使用全域批次部署的詳細資訊。
2024 年 7 月
GPT-4o mini 現在可供微調使用
GPT-4o mini 微調現已在瑞典中部和美國中北部提供公開預覽版。
助理檔案搜尋工具現已開始計費
從現在起,使用助理檔案搜尋 (部分機器翻譯) 工具會產生額外費用。 如需詳細資訊,請參閱定價頁面。
GPT-4o mini 模型可供部署
GPT-4o mini 是最新的 Azure OpenAI 模型,於 2024 年 7 月 18 日首次發佈 (英文):
「GPT-4o mini 可讓客戶以低廉成本和驚人速度交付令人驚嘆的應用程式。 GPT-4o mini 不僅比 GPT-3.5 Turbo 更為聰明,在測量大規模多工處理語言理解 (MMLU) 方面得分為 82% (GPT-3.5 Turbo 得分為 70%),還能節省至少 60% 費用。1 此模型提供擴充的 128K 內容視窗,並整合改善的 GPT-4o 多語系功能,為世界各地的語言帶來更高品質。」
此模型目前適用於美國東部區域的標準部署和全域標準部署。
如需模型配額的相關資訊,請參閱配額和限制頁面。如需模型可用性的最新資訊,請參閱模型頁面。
新的負責任 AI 預設內容篩選原則
新的預設內容篩選原則 DefaultV2
提供最新的 GPT 模型系列 (文字) 安全防護功能,包括:
- Prompt Shields,用於使用者提示 (篩選) 的越獄攻擊,
- 模型完成時對文字 (篩選條件) 進行受(版權)保護素材偵測
- 模型完成時對程式碼 (標註) 進行受(版權)保護素材偵測
雖然現有資源和部署的內容篩選沒有變更 (預設或自訂內容篩選設定保持不變),但新的資源和 GPT 部署會自動繼承新的內容篩選原則 DefaultV2
。 客戶可以選擇在安全預設值與建立自訂內容篩選設定之間切換。
如需詳細資訊,請參閱預設安全原則文件。
新的 GA API 版本
API 版本 2024-06-01
是最新的 GA 資料平面推斷 API 版本。 它會取代 API 版本 2024-02-01
,並新增以下的支援:
- 內嵌
encoding_format
和dimensions
參數。 - 聊天完成
logprobs
和top_logprobs
參數。
如需詳細資訊,請參閱我們的資料平面推斷參考文件。
擴充 gpt-4o 全球標準部署可用的區域
GPT-4o 現在可用於全域標準部署:
- australiaeast
- brazilsouth
- canadaeast
- eastus
- eastus2
- francecentral git
- germanywestcentral
- japaneast
- koreacentral
- northcentralus
- norwayeast
- polandcentral
- southafricanorth
- southcentralus
- southindia
- swedencentral
- switzerlandnorth
- uksouth
- westeurope
- westus
- westus3
如需全域標準配額的相關資訊,請參閱配額和限制頁面。
2024 年 6 月
淘汰日期更新
- 已將
gpt-35-turbo
0301 淘汰日期更新為 2024 年 10 月 1 日。 - 已將
gpt-35-turbo
和gpt-35-turbo-16k
0613 淘汰日期更新為 2024 年 10 月 1 日。 - 已將
gpt-4
和gpt-4-32k
0314 取代日期更新為 2024 年 10 月 1 日,以及將淘汰日期更新為 2025 年 6 月 6 日。
如需模型取代與淘汰的最新資訊,請參閱模型淘汰指南。
微調的權杖型計費
- Azure OpenAI 微調計費現在是以訓練檔案中的權杖數目為基礎,而不是總耗用訓練時間。 這可能會導致某些訓練執行的成本大幅降低,並讓預估微調成本變得更加容易。 若要深入了解,您可以參閱官方公告。
GPT-4o 在新區域中發行
- GPT-4o 現在也可用於:
- 瑞典中部標準區域部署。
- 澳大利亞東部、加拿大東部、日本東部、南韓中部、瑞典中部、瑞士北部與美國西部 3 進行佈建的部署。
如需模型可用性的最新資訊,請參閱模型頁面。
小幫手的客戶自控金鑰 (CMK) 支援
小幫手中的執行緒和檔案現在支援下列區域中的 CMK:
- 美國西部 3
2024 年 5 月
GPT-4o 佈建的部署
gpt-4o
版本:2024-05-13
可用於標準和佈建的部署。 佈建和標準模型部署同時接受文字和影像/視覺推斷要求。
如需模型區域可用性的相關信息,請參閱已布建部署的模型矩陣。
小幫手 v2 (預覽版)
小幫手 API 的重新整理現已公開提供。 其中包含下列更新:
- 檔案搜尋工具和向量儲存體
- 用於管理權杖使用方式的最大完成和最大提示權杖支援。
- 用於強制小幫手使用指定工具的
tool_choice
參數。 您現在可以使用小幫手角色來建立訊息,以在執行緒中建立自訂對話歷史記錄。 - 支援
temperature
、top_p
、response_format
參數。 - 串流和輪詢支援。 您可以使用 Python SDK 中的協助程式函式來建立執行和串流回應。 我們同時新增輪詢 SDK 協助程式來共享物件狀態更新,而不需要輪詢。
- 使用 Azure OpenAI Studio 來實驗 Logic Apps 和函式呼叫。 將 Logic Apps 中實作的 REST API 作為函式匯入,工作室會根據使用者提示自動叫用該函式 (作為 Logic Apps 工作流程)。
- Microsoft Research 的 AutoGen 提供多代理程式對話架構,可在各種應用程式中方便建立大型語言模型 (LLM) 工作流程。 Azure OpenAI 小幫手現在已透過
GPTAssistantAgent
整合到 AutoGen 中,這是一個新的實驗代理程式,可讓您順暢地將小幫手新增至 AutoGen 型多代理程式工作流程。 這可讓多個 Azure OpenAI 小幫手專門用於協作和處理複雜的工作或領域。 - 支援下列區域中微調的
gpt-3.5-turbo-0125
模型:- 美國東部 2
- 瑞典中部
- 已針對下列專案展開區域支援:
- 日本東部
- 英國南部
- 美國西部
- 美國西部 3
- 挪威東部
如需詳細資訊,請參閱小幫手的部落格文章。
GPT-4o 模型正式發行 (GA)
GPT-4o (「o 表示為 omni」) 是 OpenAI 於 2024 年 5 月 13 日推出的最新模型。
- GPT-4o 將文字和影像整合在單一模型中,使其能夠同時處理多個資料類型。 這種多模式方法可增強人類電腦互動的精準度和回應性。
- GPT-4o 在英語文字和編碼工作時會與 GPT-4 Turbo 進行比對,同時在非英文語言和視覺工作中提供卓越的效能,為 AI 能力樹立新的基準。
如需模型區域可用性的資訊,請參閱模型頁面。
全域標準部署類型 (預覽版)
全域部署可在與非全域供應專案相同的 Azure OpenAI 資源中使用,但可讓您利用 Azure 的全域基礎結構,以動態方式將流量路由傳送至資料中心,並針對每個要求提供最佳可用性。 全域標準為新模型提供最高的預設配額,並不需要跨多個資源進行負載平衡。
如需詳細資訊,請參閱部署類型指南。
微調更新
- 現在可在公開預覽版中使用 GPT-4 微調。
- 已新增種子、事件、完整驗證統計資料的支援,以及在
2024-05-01-preview
API 版本中作為部分檢查點。
DALL-E 和包含視覺功能的 GPT-4 Turbo GA 可設定的內容篩選條件
為 DALL-E 2 和 3、包含視覺功能的 GPT-4 Turbo GA (turbo-2024-04-09
) 以及 GPT-4o 部署建立自訂內容篩選條件。 內容篩選
適用於所有 Azure OpenAI 客戶的非同步篩選條件
在串流案例中以非同步方式執行篩選,以改善串流案例的延遲,現在適用於所有 Azure OpenAI 客戶。 內容篩選
提示盾
提示防護可保護由 Azure OpenAI 模型提供的應用程式免受兩種類型的攻擊:直接攻擊 (越獄) 和間接攻擊。 間接攻擊(也稱為「間接提示攻擊」或「跨網域提示插入攻擊」)是一種攻擊類型,由產生 AI 模型提供的系統,當應用程式處理應用程式未由應用程式開發人員或使用者直接撰寫的資訊時,可能會發生這種攻擊。 內容篩選
2024-05-01-preview API 版本
- 如需詳細資訊,請參閱 API 版本生命週期。
GPT-4 Turbo 模型正式發行 (GA)
GPT-4 Turbo 的最新 GA 版本為:
gpt-4
版本:turbo-2024-04-09
這是下列預覽模型的取代:
gpt-4
版本:1106-Preview
gpt-4
版本:0125-Preview
gpt-4
版本:vision-preview
OpenAI 與 Azure OpenAI GPT-4 Turbo GA 模型之間的差異
- OpenAI 的最新
0409
turbo 模型版本支援所有推斷要求的 JSON 模式和函式呼叫。 - Azure OpenAI 的最新
turbo-2024-04-09
版本目前不支援以影像 (視覺) 輸入進行推斷要求時使用 JSON 模式和函式呼叫。 以文字為基礎的輸入要求 (沒有image_url
和內嵌影像的要求) 支援 JSON 模式和函式呼叫。
GPT-4 視覺預覽的差異
- Azure AI 特定的視覺增強功能與含有視覺功能的 GPT-4 Turbo 整合,不支援
gpt-4
版本:turbo-2024-04-09
。 這包括光學字元辨識 (OCR)、物件基礎、影片提示,以及使用影像改善資料的處理。
重要
一旦將 gpt-4
版本: vision-preview
升級至 turbo-2024-04-09
,則視覺增強預覽功能 (包括光學字元辨識 (OCR)、物件接地、影片提示) 即會淘汰且無法再使用。 如果您目前依賴上述任何預覽功能,此自動模型升級將會是重大變更。
GPT-4 Turbo 佈建的受控可用性
gpt-4
版本:turbo-2024-04-09
可用於標準和佈建的部署。 目前此模型的佈建版本不支援影像/視覺推斷要求。 此模型的佈建部署只接受文字輸入。 標準模型部署同時接受文字和影像/視覺推斷要求。
部署包含視覺功能的 GPT-4 Turbo GA
若要從 Azure AI Foundry 入口網站部署 GA 模型,請從下拉功能表中選取 GPT-4
並選擇 turbo-2024-04-09
版本。 gpt-4-turbo-2024-04-09
模型的預設配額會與 GPT-4-Turbo 目前的配額相同。 請參閱區域配額限制。
2024 年 4 月
美國東部 2 和瑞士西部兩個新區域現在支援微調
微調現已提供下列支援:
美國東部 2
gpt-35-turbo
(0613)gpt-35-turbo
(1106)gpt-35-turbo
(0125)
瑞士西部
babbage-002
davinci-002
gpt-35-turbo
(0613)gpt-35-turbo
(1106)gpt-35-turbo
(0125)
檢查模型頁面,以取得每個區域中模型可用性和微調支援的最新資訊。
多回合聊天訓練範例
微調現在支援多回合聊天訓練範例。
GPT-4 (0125) 可用於以自有資料為基礎的 Azure OpenAI
您現在可以在可用區域透過以自有資料為基礎的 Azure OpenAI 使用 GPT-4 (0125) 模型。
2024 年 3 月
Azure OpenAI Studio 中的風險與安全監視
Azure OpenAI Studio 現在會針對使用內容篩選條件設定的每個部署提供風險與安全儀表板。 使用其來檢查篩選活動的結果。 然後,您可以調整篩選條件設定,以更好地滿足企業需求,並符合負責任 AI 原則。
以自有資料為基礎的 Azure OpenAI 更新
- 您現在可以連線到 Elasticsearch 向量資料庫,以便與以自有資料為基礎的 Azure OpenAI 搭配使用。
- 您可以在資料擷取期間,使用區塊大小參數,來設定索引中任何指定資料區塊的權杖數目上限。
2024 年 2 月 1 日正式發行 (GA) API 版本
這是最新的 GA API 版本,並且是舊版 2023-05-15
GA 版本的取代版。 此版本新增支援最新的 Azure OpenAI GA 功能,例如 Whisper、DALLE-3、微調數據等等。
處於預覽狀態的功能,例如小幫手、文字到語音轉換(TTS),以及某些「數據上的」數據源,都需要預覽 API 版本。 如需詳細資訊,請參閱我們的 API 版本生命週期指南。
Whisper 正式發行 (GA)
Whisper 語音轉換文字模型現在是 REST 和 Python 的 GA。 用戶端程式庫 SDK 目前仍處於公開預覽狀態。
請遵循快速入門來試用 Whisper。
DALL-E 3 正式發行 (GA)
DALL-E 3 影像產生模型現在是 REST 和 Python 的 GA。 用戶端程式庫 SDK 目前仍處於公開預覽狀態。
請遵循快速入門來試用 DALL-E 3。
DALL-E 3 的新區域支援
除了 SwedenCentral
之外,您現在還可以使用 East US
或 AustraliaEast
Azure 區域中的 Azure OpenAI 資源存取 DALL-E 3。
模型取代和淘汰
我們已新增頁面來追蹤 Azure OpenAI 服務中的模型取代和淘汰。 此頁面提供目前可用、已取代和淘汰之模型的相關資訊。
2024-03-01-preview API 已發行
2024-03-01-preview
具有與 2024-02-15-preview
相同的功能,並新增兩個新的參數進行內嵌:
encoding_format
可讓您指定要在float
或base64
中產生內嵌的格式。 預設值為float
。dimensions
可讓您設定輸出內嵌的數目。 只有新的第三代內嵌模型才支援此參數:text-embedding-3-large
、text-embedding-3-small
。 一般而言,從計算、記憶體和儲存體的觀點來看,較大的內嵌成本會更高。 調整維度數目的功能可讓您更充分掌控整體成本和效能。dimensions
OpenAI 1.x Python 連結庫的所有版本都不支援 此參數,若要利用此參數,建議您升級至最新版本:pip install openai --upgrade
。
如果您目前使用預覽 API 版本來利用最新功能,建議您諮詢 API 版本生命週期 一文,以追蹤目前 API 版本將支援多久。
更新至 GPT-4-1106-Preview 升級方案
計劃原定於 2024 年 3 月 8 日從 gpt-4
1106-Preview 部署升級到 gpt-4
0125-Preview 的方案已不再進行。 設定為「自動更新為預設值」和「過期時升級」的 gpt-4
版本 1106-Preview 和 0125-Preview 的部署,將在模型的穩定版本發佈後開始升級。
如需升級流程的詳細資訊,請參閱模型頁面。
2024 年 2 月
GPT-3.5-turbo-0125 模型可供使用
此模型進行了各種改善,包括提高以要求格式回應的精確度,以及修正導致非英文語言函式呼叫的文字編碼問題的錯誤 (bug)。
如需模型區域可用性和升級的資訊,請參閱模型頁面。
第三代內嵌模型可供使用
text-embedding-3-large
text-embedding-3-small
在測試中,OpenAI 報告顯示大型和小型第三代內嵌模型在 MIRACL 基準中提供了更好的平均多語言擷取效能,同時在 MTEB 基準中仍保持比第二代 text-embedding-ada-002 模型更好的英文工作效能。
如需模型區域可用性和升級的資訊,請參閱模型頁面。
GPT-3.5 Turbo 配額彙總
為了簡化不同版本的 GPT-3.5-Turbo 模型之間的移轉(包括 16k),我們將將所有 GPT-3.5-Turbo 配額合併成單一配額值。
任何已核准新增配額的客戶都將獲得反映先前新增的總配額。
預設情況下,任何目前跨模型版本的總使用量小於預設值的客戶都將獲得新的合併總配額。
GPT-4-0125-preview 模型可供使用
gpt-4
模型版本 0125-preview
現在可在美國東部、美國中北部和美國中南部區域的 Azure OpenAI 服務上使用。 部署 gpt-4
版本 1106-preview
的客戶將在未來幾週內自動升級至 0125-preview
。
如需模型區域可用性和升級的資訊,請參閱模型頁面。
小幫手 API 公開預覽版
Azure OpenAI 現在支援為 OpenAI 的 GPT 提供支援的 API。 Azure OpenAI Assistants (預覽版) 可讓您透過自訂指示和程式碼解譯器等進階工具以及自訂函式來建立適合您需求的 AI 小幫手。 若要深入了解,請參閱:
OpenAI 文字轉換語音的語音公開預覽版
Azure OpenAI 服務現在支援具有 OpenAI 語音的文字轉換語音 API。 從您提供的文字取得 AI 產生的語音。 若要深入了解,請參閱概觀指南,並嘗試快速入門。
注意
Azure AI 語音同時支援 OpenAI 文字轉換語音。 若要深入了解,請參閱透過 Azure OpenAI 服務或透過 Azure AI 語音實現 OpenAI 文字轉換語音聲音指南。
新的微調功能和模型支援
以自有資料為基礎的 Azure OpenAI 的新區域支援
您現在可以在下列 Azure 區域中使用以自有資料為基礎的 Azure OpenAI:
- 南非北部
以自有資料為基礎的 Azure OpenAI 正式發行
- 以自有資料為基礎的 Azure OpenAI 現已正式推出。
2023 年 12 月
以自有資料為基礎的 Azure OpenAI
- 以自有資料為基礎的 Azure OpenAI 的完整 VPN 和私人端點支援,包括對以下內容的安全性支援:儲存體帳戶、Azure OpenAI 資源和 Azure AI 搜尋服務資源。
- 使用虛擬網路和私人端點來保護數據,以使用 Azure OpenAI On Data 設定的新文章。
包含視覺功能的 GPT-4 Turbo 現可供使用
Azure OpenAI 服務上包含視覺功能的 GPT-4 Turbo 現在處於公開預覽狀態。 包含視覺功能的 GPT-4 Turbo 是由 OpenAI 開發的大型多模態模型 (LMM),可分析影像並針對影像問題提供文字回應。 它同時包含自然語言處理和視覺理解。 透過增強模式,您可以使用 Azure AI 視覺功能,從影像產生其他見解。
- 使用 Azure OpenAI Playground,以無程式碼體驗探索包含視覺功能的 GPT-4 Turbo。 請參閱快速入門指南以深入了解。
- 使用包含視覺功能的 GPT-4 Turbo 進行視覺增強現已在 Azure OpenAI Playground 中提供,包括對光學字元辨識、物件接地、「新增資料」的影像支援以及對視訊提示的支援。
- 使用 REST API 直接呼叫聊天 API。
- 區域可用性目前僅限於
SwitzerlandNorth
、SwedenCentral
、WestUS
和AustraliaEast
- 深入了解包含視覺功能的 GPT-4 Turbo 和其他常見問題的已知限制。
2023 年 11 月
以自有資料為基礎的 Azure OpenAI 中的新資料來源支援
- 您現在可以使用 適用於 MongoDB 的 Azure Cosmos DB 虛擬核心 和 URL/網址作為數據源,以內嵌您的數據,並與支援的 Azure OpenAI 模型聊天。
GPT-4 Turbo 預覽版與 GPT-3.5-Turbo-1106 發行
這兩個模型都是 OpenAI 的最新版本,具有改善的指令遵循、JSON 模式、可重現的輸出以及平行函式呼叫。
GPT-4 Turbo 預覽版具有 128,000 個權杖的最大內容視窗,而且可以產生 4,096 個輸出權杖。 其擁有截至 2023 年 4 月的最新訓練資料。 此模型處於預覽狀態,不建議用於生產環境。 一旦穩定版本可供使用,此預覽模型的所有部署都將自動更新。
GPT-3.5-Turbo-1106 具有 16,385 個權杖的最大內容視窗,而且可以產生 4,096 個輸出權杖。
如需模型區域可用性的資訊,請參閱模型頁面。
每個地區的模型都有自己唯一的配額配置。
DALL-E 3 公開預覽
DALL-E 3 是 OpenAI 的最新影像產生模型。 其具有增強的影像品質、更複雜的場景,以及在影像中轉譯文字時改善效能。 同時隨附更多外觀比例選項。 DALL-E 3 可透過 OpenAI Studio 和 REST API 取得。 您的 OpenAI 資源必須位於 SwedenCentral
Azure 區域中。
DALL-E 3 包含內建的提示重寫,以增強影像、減少偏差,以及增加自然變化。
請遵循快速入門來試用 DALL-E 3。
負責 AI
擴充客戶可設定性:所有 Azure OpenAI 客戶現在可以針對仇恨、暴力、性及自我傷害類別設定所有嚴重性層級 (低、中、高),包括僅篩選高嚴重性內容。 設定內容篩選條件
所有 DALL-E 模型中的內容憑證:來自所有 DALL-E 模型的 AI 產生的影像現在包含數位憑證,以 AI 產生的方式揭露內容。 顯示影像資產的應用程式可以利用開放原始碼 Content Authenticity Initiative SDK,在其 AI 產生的影像中顯示憑證。 Azure OpenAI 中的內容憑證
新的 RAI 模型
- 越獄風險偵測:越獄攻擊是使用者提示,其設計目的是要引發產生 AI 模型,以展示其定型的行為,以避免或打破系統訊息中設定的規則。 越獄風險偵測模型為可選服務 (預設為關閉),可在標註和篩選模型中取得。 其根據使用者提示執行。
- 受保護的資料文字:受保護的資料文字描述已知的文字內容 (例如歌曲歌詞、文章、食譜和選取的 Web 內容),這些內容可由大型語言模型輸出。 受保護的資料文字為可選服務 (預設為關閉),可在標註和篩選模型中取得。 其會根據 LLM 完成執行。
- 受保護的資料程式碼:受保護的資料程式碼描述與公用存放庫的一組原始程式碼相符的原始程式碼,這些原始程式碼可由大型語言模型輸出,而不需要適當的來源存放庫引文。 受保護的資料程式碼為可選服務 (預設為關閉),可在標註和篩選模型中取得。 其會根據 LLM 完成執行。
封鎖清單:客戶現在可以藉由在篩選條件中建立自訂封鎖清單,快速自訂提示和完成的內容篩選行為。 自訂封鎖清單可讓篩選條件在自訂模式清單上採取動作,例如特定字詞或 Regex 模式。 除了自訂封鎖清單之外,我們還提供 Microsoft 粗話封鎖清單 (英文)。 使用封鎖清單
2023 年 10 月
新的微調模型 (預覽版)
gpt-35-turbo-0613
現在可供微調使用。babbage-002
和davinci-002
現在可供微調使用。 這些模型會取代先前可用於微調的舊版 ada、babbage、curie 和 davinci 基底模型。微調可用性僅限於特定區域。 檢查模型頁面,以取得每個區域中模型可用性的最新資訊。
微調模型與一般模型有不同的配額限制。
以自有資料為基礎的 Azure OpenAI
- 新的自訂參數可用於判斷所擷取的文件數目和嚴謹度。
- 嚴謹度設定會將文件分類為與查詢相關的閾值。
- 擷取的文件設定會指定用來產生回應之資料索引中評分最高的文件數目。
- 您可以在 Azure OpenAI Studio 中看到資料擷取/上傳狀態。
- 支援 Blob 容器的私人端點和 VPN。
2023 年 9 月
GPT-4
GPT-4 和 GPT-4-32k 現在可供所有 Azure OpenAI 服務客戶使用。 客戶不再需要申請等候清單,才能使用 GPT-4 和 GPT-4-32k (有限存取權註冊需求會繼續申請所有 Azure OpenAI 模型)。 可用性可能因區域而異。 檢查模型頁面,以取得每個區域中模型可用性的最新資訊。
GPT-3.5 Turbo 指示
Azure OpenAI 服務現在支援 GPT-3.5 Turbo 指示模型。 此模型具有與 text-davinci-003
媲美的效能,可與完成 API 搭配使用。 檢查模型頁面,以取得每個區域中模型可用性的最新資訊。
Whisper 公開預覽
Azure OpenAI 服務現在支援由 OpenAI 的 Whisper 模型所提供的語音轉換文字 API。 根據您提供的語音音訊取得 AI 產生的文字。 如需詳細資訊,請參閱快速入門。
注意
Azure AI 語音同時透過批次謄寫 API 支援 OpenAI 的 Whisper 模型。 若要深入了解,請參閱建立批次轉譯指南。 請參閱什麼是 Whisper 模型?深入了解何時使用 Azure AI 語音與Azure OpenAI 服務。
新區域
- Azure OpenAI 現已在瑞典中部和瑞士北部地區推出。 檢查模型頁面,以取得每個區域中模型可用性的最新資訊。
區域配額限制調高
- 增加至特定模型和區域的最大預設配額限制。 將工作負載遷移至這些模型和區域,可讓您能夠利用每分鐘較高的權杖 (TPM)。
2023 年 8 月
以自有資料為基礎的 Azure OpenAI (預覽版) 更新
- 您現在可以將以自有資料為基礎的 Azure OpenAI 部署到 Power Virtual Agents。
- 以自有資料為基礎的 Azure OpenAI 現在支援私人端點。
- 能夠篩選敏感性文件的存取權。
- 依排程自動重新整理索引。
- 向量搜尋及語意搜尋選項。
- 在已部署的 Web 應用程式中檢視聊天記錄
2023 年 7 月
函式呼叫支援
- Azure OpenAI 現在支援函式呼叫,可讓您在聊天完成 API 中使用函式。
內嵌輸入陣列增加
- Azure OpenAI 現在透過 text-embedding-ada-002 第 2 版支援每個 API 請求最多具有 16 個輸入的陣列。
新區域
- Azure OpenAI 現在也適用於加拿大東部、美國東部 2、日本東部和美國中北部區域。 檢查模型頁面,以取得每個區域中模型可用性的最新資訊。
2023 年 6 月
以自有資料為基礎的 Azure OpenAI (預覽版)
- 以自有資料為基礎的 Azure OpenAI 現在可供預覽,可讓您與 GPT-35-Turbo 和 GPT-4 等 OpenAI 模型聊天,並根據您的資料接收回應。
新版本的 gpt-35-turbo 和 gpt-4 模型
- gpt-35-turbo (0613 版)
- gpt-35-turbo-16k (0613 版)
- gpt-4 (0613 版)
- gpt-4-32k (0613 版)
英國南部
- Azure OpenAI 現在已對英國南部區域開放。 檢查模型頁面,以取得每個區域中模型可用性的最新資訊。
內容篩選與註釋 (預覽版)
配額
- 配額可讓您彈性管理訂閱帳戶內跨部署的速率限制配置。
2023 年 5 月
JAVA 與 JavaScript SDK 支援
- 新的 Azure OpenAI 預覽軟體開發套件提供了對 JavaScript 和 JAVA 的支援。
Azure OpenAI 聊天完成正式發行 (GA)
- 正式發行支援:
- 聊天完成 API 版本
2023-05-15
。 - GPT-35-Turbo 模型。
- GPT-4 模型系列。
- 聊天完成 API 版本
如果您目前使用 2023-03-15-preview
API,建議您移轉至 GA 2023-05-15
API。 如果您目前使用 API 版本 2022-12-01
,此 API 仍為 GA,但不包含最新的聊天完成功能。
重要
使用目前版本的 GPT-35-Turbo 模型和完成端點仍處於預覽狀態。
法國中部
- Azure OpenAI 現在已對法國中部區域開放。 檢查模型頁面,以取得每個區域中模型可用性的最新資訊。
2023 年 4 月
DALL-E 2 公開預覽。 Azure OpenAI 服務現在支援由 OpenAI 的 DALL-E 2 模型所提供的影像產生 API。 根據您提供的描述性文字取得 AI 產生的影像。 如需詳細資訊,請參閱快速入門。
現在,自訂模型的非作用中部署會在 15 天後刪除;模型仍可供重新部署。 如果自訂 (微調) 模型是在超過十五 (15) 天前部署,且在此期間未對其進行完成或聊天完成呼叫,則將自動刪除部署 (針對該部署,不會產生進一步的裝載費用)。 基本自訂模型將維持可用狀態,且可以隨時重新部署。 若要深入了解,請參閱操作說明文章。
2023 年 3 月
GPT-4 系列模型現在可在 Azure OpenAI 上預覽。 如需要求存取權,現有的 Azure OpenAI 客戶可以透過填寫此表單以提出申請。 這些模型目前於美國東部和美國中南部區域提供。
3/21 發行的 GPT-35-Turbo 和 GPT-4 模型的新聊天完成 API 預覽版。 若要深入了解,請參閱更新的快速入門和操作方式文章。
GPT-35-Turbo 預覽版。 若要深入了解,請參閱操作方式文章。
為微調增加的訓練限制:所有模型的最大訓練作業大小 (訓練檔案中的權杖) x (時期數) 為 20 億個權杖。 我們也已將訓練作業上限從 120 增加到 720 小時。
將其他使用案例新增至您現有的存取權。 先前,新增使用案例的流程需要客戶重新申請服務。 現在,我們推出新的流程,讓您快速新增使用案例以使用服務。 此流程遵循 Azure AI 服務內已建立的有限存取流程。 現有的客戶可以在這裡證明任何和所有新的使用案例。 請注意,每當您想要針對您原本未申請的新使用案例使用服務時,都需要這樣做。
2023 年 2 月
新功能
- .NET SDK (推斷) 預覽版本 | 範例
- Terraform SDK 更新以支援 Azure OpenAI 管理作業。
suffix
參數現在支援在完成結束時插入文字。
更新
- 內容篩選依預設會開啟。
新文章:
新訓練課程:
2023 年 1 月
新功能
服務 GA。 Azure OpenAI 服務現已正式推出。
新模型:新增最新的文字模型、text-davinci-003 (美國東部、西歐)、text-ada-embeddings-002 (美國東部、美國中南部、西歐)
2022 年 12 月
新功能
OpenAI 的最新模型。 Azure OpenAI 可讓您存取所有最新的模型,包括 GPT-3.5 系列。
新 API 版本 (2022-12-01)。 此更新包含數個要求的增強功能,包括 API 回應中的權杖使用資訊、改善檔案的錯誤訊息、在微調建立資料結構上與 OpenAI 保持一致,以及支援尾碼參數,以允許自訂微調作業的命名。
每秒更高的要求限制。 非 Davinci 模型為 50。 Davinci 模型為 20。
更快速地微調部署。 在 10 分鐘內部署 Ada 和 Curie 微調模型。
更高的訓練限制: Ada、Bightge 和 Curie 為 40M 訓練權杖。 Davinci 為 10M。
請求修改濫用和誤用資料記錄及人工檢閱的流程。 目前,服務會記錄要求/回應資料,以便進行濫用和誤用偵測,以確保這些功能強大的模型不被濫用。 不過,許多客戶都有嚴格的資料隱私權和安全性需求,需要更充分地控制其資料。 為了支援這些使用案例,我們會發佈新的流程,讓客戶修改內容篩選原則,或關閉低風險使用案例的濫用記錄。 此流程遵循 Azure AI 服務內已建立的有限存取流程,而現有的 OpenAI 客戶可以在此處申請。
客戶自控金鑰加密。 CMK 提供用來儲存訓練資料和自訂模型的自有加密金鑰,讓客戶在 Azure OpenAI 的資料管理中取得更充分的控制能力。 客戶自控金鑰 (CMK) 也稱為自備金鑰 (BYOK),可提供更大的彈性來建立、輪替、停用及撤銷存取控制。 您也可稽核用來保護資料的加密金鑰。 從我們的待用加密文件中深入了解。
Lockbox 支援
SOC-2 合規性
透過 Azure 資源健康狀態、成本分析和計量與診斷設定進行記錄與診斷。
Studio 改善項目。 許多 Studio 工作流程的可用性改善項目,包括 Azure AD 角色支援,以控制小組中誰可以建立微調的模型和部署。
變更 (中斷性)
微調建立 API 要求已更新,以符合 OpenAI 的架構。
預覽 API 版本:
{
"training_file": "file-XGinujblHPwGLSztz8cPS8XY",
"hyperparams": {
"batch_size": 4,
"learning_rate_multiplier": 0.1,
"n_epochs": 4,
"prompt_loss_weight": 0.1,
}
}
API 版本 2022-12-01:
{
"training_file": "file-XGinujblHPwGLSztz8cPS8XY",
"batch_size": 4,
"learning_rate_multiplier": 0.1,
"n_epochs": 4,
"prompt_loss_weight": 0.1,
}
內容篩選依預設會暫時關閉。 Azure 內容仲裁的運作方式與 Azure OpenAI 不同。 Azure OpenAI 會在產生呼叫期間執行內容篩選,以偵測有害或濫用的內容,並從回應中加以篩選。 深入了解
這些模型將在 2023 第 1 季中重新啟用,且預設為開啟。
客戶動作
- 如果您想為您的訂閱帳戶開啟這些支援,請連絡 Azure 支援。
- 如果您想要這些修改保持關閉,請套用篩選修改。 (此選項僅適用於低風險的使用案例。)