規劃管理 Azure OpenAI 服務的成本
本文說明您可以如何規劃及管理 Azure OpenAI 服務的成本。 部署服務之前,請使用 Azure 定價計算機來預估 Azure OpenAI 的成本。 稍後,當您部署 Azure 資源時,請檢閱預估成本。 當您開始使用 Azure OpenAI 資源後,請使用 [成本管理] 功能來設定預算和監視成本。
您也可以檢閱預測成本,並找出花費趨勢來識別您可能想要採取行動的區域。Azure OpenAI 服務的成本只是您的 Azure 帳單中每月成本的一部分。 雖然本文是關於如何規劃和管理 Azure OpenAI 的成本,但您還必須支付 Azure 訂用帳戶中使用的所有 Azure 服務和資源的費用,包括協力廠商服務。
必要條件
成本管理中的成本分析支援大部分的 Azure 帳戶類型,但並非全部。 若要檢視所支援帳戶類型的完整清單,請參閱了解成本管理資料。 若要檢視成本資料,您至少需要 Azure 帳戶的讀取存取權。 如需 Microsoft 成本管理資料的存取權指派相關資訊,請參閱指派資料的存取權。
先估計成本再使用 Azure OpenAI
使用 Azure 定價計算機來預估使用 Azure OpenAI 的成本。
了解 Azure OpenAI 完整計費模型
Azure OpenAI 服務會在 Azure 基礎結構上執行,當您部署新的資源時,就會產生成本。 可能會產生其他基礎結構成本。 下列各節說明如何針對 Azure OpenAI 服務收費。
模型推斷聊天完成
Azure OpenAI 聊天完成模型推斷會根據模型和部署類型,依不同費率依每個 1,000 個令牌收費。
Azure OpenAI 模型會藉由將文字細分成語彙基元來了解和處理文字。 如需參考,每個語彙基元大約是一般英文文字的四個字元。
輸入和輸出都會產生權杖成本。 例如,假設您有 1,000 個 Token JavaScript 程式碼範例,並要求 Azure OpenAI 模型轉換為 Python。 您將需要為傳送的初始輸入要求支付約 1,000 個 Token,並為收到的回應輸出支付 1,000 個Token,總共 2,000 個 Token。
在實務上,針對這種類型的完成呼叫,Token 輸入/輸出不會完全是 1:1。 從某個程式設計語言轉換成另一種程式設計語言,可能會根據許多因素產生較長或較短的輸出。 其中一個此類因素是指派給 max_tokens
參數的值。
微調的模型
Azure OpenAI 微調模型會根據 定型檔案中的令牌數目收費。 如需最新的價格,請參閱 官方定價頁面。
部署微調的模型之後,您也會根據下列項目收費:
- 裝載時數
- 每 1,000 個權杖的推斷(依輸入使用量和輸出使用量細分)
裝載時數成本很重要,因為一旦部署微調的模型後,不論您是否主動使用,此模型都會持續產生每小時成本。 密切監視已部署的微調模型成本。
重要
部署自訂模型之後,如果在任何時候該部署處於非使用中的狀態超過十五 (15) 天,則系統會刪除該部署。 如果模型部署的時間超過十五 (15) 天,而且在連續 15 天內沒有針對模型進行完成或聊天完成呼叫,則自訂模型的部署為「非使用中」。
刪除非使用中的部署不會刪除或影響基礎自訂模型,且自訂模型可以隨時進行重新部署。
每個部署的自訂 (微調) 模型都會產生每小時裝載成本,無論是否要對模型進行完成或聊天完成呼叫。 .
可能隨著 Azure OpenAI 服務產生的其他成本
啟用將資料傳送至 Azure 監視器記錄和警示等功能時,會針對這些服務產生額外成本。 這些成本會顯示在這些其他服務和訂用帳戶層級,但當範圍僅限 Azure OpenAI 資源時不會顯示。
將 Azure 預付款用於 Azure OpenAI 服務
您可以使用 Azure 預付款點數來支付 Azure OpenAI 服務費用。 不過,您無法使用 Azure 預付款點數來支付第三方產品和服務的費用,包括 Azure Marketplace 中找到的產品和服務。
Azure OpenAI 服務中的 HTTP 錯誤回應碼和計費狀態
如果服務執行處理,即使您的狀態代碼顯示未成功 (不是代碼 200),仍會向您收費。 例如,內容篩選或輸入限制所造成的錯誤代碼 400,或因逾時而發生的錯誤代碼 408。
如果服務未執行處理,則不會向您收費。 例如,因為驗證導致的錯誤代碼 401,或超過速率限制導致的錯誤代碼 429。
監視成本
當您搭配 Azure OpenAI 使用 Azure 資源時,便會產生費用。 Azure 資源使用量單位成本會依據時間間隔 (如秒、分鐘、小時和日) 或單位使用量 (如位元組和 MB) 而改變。 一旦 Azure OpenAI 使用開始就會產生成本,且您可以在成本分析中看到成本。
當您使用成本分析時,您會在圖表和資料表中,檢視不同時間間隔的 Azure OpenAI 成本。 一些範例包括依日期、目前和先前月份,以及年度。 您也可以根據預算和預測成本來檢視成本。 切換至更長時間的檢視,有助於找出費用趨勢。 您可以看到可能發生超支的位置。 如果您已建立預算,還可以輕鬆地查看已超出預算的位置。
若要在成本分析中檢視 Azure OpenAI 成本:
- 登入 Azure 入口網站。
- 選擇其中一個 Azure OpenAI 資源。
- 在 [資源管理] 之下,選取 [成本分析]
- 根據預設,成本分析的範圍是設定為個別的 Azure OpenAI 資源。
若要了解該成本的細分情況,可以將分組依據修改為計量並將圖表類型切換為折線。 您現在可以看到,針對此特定資源,成本的來源來自三個不同的模型系列,其中 Text-Davinci Token 代表大量成本。
當您評估與 Azure OpenAI 相關聯的成本時,請務必了解範圍。 如果您的資源是相同資源群組的一部分,您可以在該層級設定成本分析範圍,以了解對成本的影響。 如果您的資源會分散到多個資源群組,您可以限定為訂用帳戶層級。
在較高層級的範圍時,您通常需要新增更多篩選,以專注於 Azure OpenAI 使用量。 在訂用帳戶層級範圍時,您會看到一些在 Azure OpenAI 成本管理內容中您可能不在意的其他資源。 當您在訂用帳戶層級的範圍設定時,建議您瀏覽至成本管理服務底下的完整成本分析工具。
以下是如何使用成本分析工具查看訂用帳戶或資源群組累積成本的範例:
- 在頂端的 Azure 搜尋列中搜尋「成本管理」,以瀏覽至完整的服務體驗,其中包含更多選項,例如建立預算。
- 若 [範圍:] 未指向您想要分析的資源群組或訂用帳戶時,請視需要選取 [變更]。
- 在左側,選取 [報告 + 分析]>[成本分析]。
- 在 [所有檢視] 索引標籤上,選取 [累積成本]。
成本分析儀表板會顯示根據您為 [範圍] 所指定內容而分析的累積成本。
如果您嘗試依服務新增篩選條件,您會發現清單中找不到 Azure OpenAI。 之所以發生這種情況,是因為 Azure OpenAI 與一部分的 Azure AI 服務共通,其中服務等級篩選條件是認知服務。 如果您想要查看訂用帳戶中的所有 Azure OpenAI 資源,而不需要任何其他類型的 Azure AI 服務資源,請改為將範圍設定為 [服務層級:Azure OpenAI]:
建立預算
您可以建立預算來管理成本,以及建立警示,以便在出現異常消費和超支風險時通知利害關係人。 警示是以支出為基礎 (相較於預算和成本閾值)。 您可以建立 Azure 訂用帳戶和資源群組的預算和警示。 它們可作為整體成本監視策略的一部分。
如果監視要更細微呈現,您也可以在 Azure 中篩選特定資源或服務來建立預算。 篩選器可協助確保您不會意外建立新的資源,而需要支付更多的費用。 如需有關建立預算時可用篩選選項的詳細資訊,請參閱群組和篩選選項。
重要
雖然 OpenAI 有一個選項可避免您超出預算,但 Azure OpenAI 目前不提供這項功能。 您可以從動作群組開始自動化,作為預算通知的一部分,以採取更進階的動作,但這需要您進行額外的自訂開發。
匯出成本資料
您也可以將成本資料匯出至儲存體帳戶,當您需要其他人執行額外的資料分析以節省成本時,這很有幫助。 例如,財務小組可以使用 Excel 或 Power BI 來分析資料。 您可以根據每日、每週或每月排程來匯出成本,並設定自訂日期範圍。 我們建議匯出成本資料作為擷取成本資料集的方式。
下一步
- 了解如何透過 Microsoft 成本管理將雲端投資最佳化。
- 深入了解如何使用成本分析管理成本。
- 了解如何避免非預期成本。
- 參加成本管理引導式學習課程。