監視模型服務成本
本文提供如何使用 系統數據表 來監視 Azure Databricks 帳戶中馬賽克 AI 模型服務端點的成本範例。
需求
- 若要存取系統資料表,必須為 Unity Catalog 啟用工作區。 如需詳細資訊,請參閱啟用系統資料表結構描述。
計費使用量系統數據表 SKU
您可以使用計費使用量系統數據表,追蹤 Azure Databricks 中的模型服務成本。 啟用計費使用量系統數據表之後,數據表會自動填入 Databricks 帳戶中最新的使用量。 成本會出現在數據表中 system.billing.usage
,其中數據行 sku_name
如下:
sku_name |
描述 |
---|---|
<tier>_SERVERLESS_REAL_TIME_INFERENCE_LAUNCH_<region> |
此 SKU 包含當端點在調整為零之後開始時累算的所有 DBU。 |
<tier>_SERVERLESS_REAL_TIME_INFERENCE_<region> |
所有其他模型服務成本都會依此 SKU 分組。 其中 tier 會對應至您的 Azure Databricks 平臺層,並 region 對應至 Azure Databricks 部署的雲端區域。 |
查詢和視覺化使用方式
您可以查詢 system.billing.usage
數據表,以匯總與馬賽克 AI 模型服務相關聯的所有 DBU(Databricks Units)。 以下是使用 SQL 匯總過去 30 天內每天提供 DBU 的模型範例查詢:
SELECT SUM(usage_quantity) AS model_serving_dbus,
usage_date
FROM system.billing.usage
WHERE sku_name LIKE '%SERVERLESS_REAL_TIME_INFERENCE%'
GROUP BY(usage_date)
ORDER BY usage_date DESC
LIMIT 30
成本可觀察性儀錶板
若要協助您開始監視模型服務成本,請從 GitHub 下載範例成本屬性儀錶板。 請參閱 模型服務成本屬性儀錶板。
下載 JSON 檔案之後,請將儀錶板匯入工作區。 如需匯入儀錶板的指示,請參閱 匯入儀錶板檔案。
如何使用此儀錶板
此儀錶板由 AI/BI 提供,您必須能夠存取系統數據表。 其提供工作區層級服務端點成本和使用量的深入解析。
下列步驟可讓您開始使用:
- 輸入工作區標識碼。
- 選取開始日期和結束日期。
- 選取下拉式清單中的特定端點名稱來篩選儀錶板(如果您對特定端點感興趣)。
- 另外,如果您使用端點的任何自定義標籤,請輸入標籤鑰。
注意
模型服務會對工作區強制執行預設限制,以確保沒有失控支出。 請參閱模型服務限制和區域。
您可以使用的圖表
下列圖表包含在此儀錶板中。 這些是要讓您建置自定義版本的模型服務成本屬性儀錶板的起點。
- 過去 7 天最上層端點耗用量
- 每日總使用量$DBU
- 依端點類型提供成本的模型
- 按權杖付費
- CPU/GPU
- 基礎模型
- 每個模型服務類型的每日耗用量
- 前 10 個成本最高的服務端點
- 前 10 個成本最高的按令牌付費端點
- LLM 微調 過去 7 天花費
- LLM 微調每封電子郵件的支出
使用標籤來監視成本
一開始,匯總的成本可能就足以觀察整體模型服務成本。 不過,隨著端點數目增加,您可能會想要根據使用案例、業務單位或其他自定義標識符來細分成本。 模型服務支援建立可套用至您模型服務端點的自定義標籤。
套用至模型服務端點的所有自定義標籤都會傳播至 system.billing.usage
數據行底下的 custom_tags
數據表,並可用來匯總和可視化成本。 Databricks 建議將描述性標籤新增至每個端點,以進行精確的成本追蹤。
查詢範例
依成本排序的最上層端點:
SELECT
usage_metadata.endpoint_name AS endpoint_name,
SUM(usage_quantity) AS model_serving_dbus
FROM
system.billing.usage
WHERE
sku_name LIKE '%SERVERLESS_REAL_TIME_INFERENCE%'
AND usage_metadata.endpoint_name IS NOT NULL
GROUP BY endpoint_name
ORDER BY model_serving_dbus DESC
LIMIT 30;
標籤的成本(「business_unit」: 「數據科學」) 一段時間:
SELECT
SUM(usage_quantity) AS model_serving_dbus,
usage_date
FROM
system.billing.usage
WHERE sku_name LIKE '%SERVERLESS_REAL_TIME_INFERENCE%'
AND custom_tags['business_unit'] = 'data science'
GROUP BY usage_date
ORDER BY usage_date DESC
LIMIT 30
其他資源
如需如何監視帳戶中作業成本的範例,請參閱 使用系統數據表監視作業成本。