計費使用量系統數據表參考
本文提供可計費使用量系統數據表的概觀,包括架構和範例查詢。 使用系統數據表時,您的帳戶計費使用量數據會集中並路由傳送到所有區域,因此您可以從工作區所在的哪個區域檢視帳戶的全域使用量。
如需使用此資料表監視成本和範例查詢的資訊,請參閱使用系統資料表監視成本 。
資料表路徑:此系統資料表位於 system.billing.usage
。
計費使用量數據表架構
計費使用量系統數據表會使用下列架構:
欄位名稱 | 資料類型 | 描述 | 範例 |
---|---|---|---|
record_id |
字串 | 此使用記錄的唯一標識碼 | 11e22ba4-87b9-4cc2-9770-d10b894b7118 |
account_id |
字串 | 產生此報告之帳戶的標識碼 | 23e22ba4-87b9-4cc2-9770-d10b894b7118 |
workspace_id |
字串 | 與此使用方式相關聯的工作區識別碼 | 1234567890123456 |
sku_name |
字串 | SKU 的名稱 | STANDARD_ALL_PURPOSE_COMPUTE |
cloud |
字串 | 與此用途相關聯的雲端服務。 可能的值為 AWS 、AZURE 和 GCP 。 |
AWS 、 AZURE 或 GCP |
usage_start_time |
時間戳記 | 與這個使用量記錄相關的開始時間。 時區資訊會記錄在值的結尾,+00:00 代表 UTC 時區。 |
2023-01-09 10:00:00.000+00:00 |
usage_end_time |
時間戳記 | 與這個使用記錄相關的結束時間。 時區資訊會記錄在值的結尾,+00:00 代表 UTC 時區。 |
2023-01-09 11:00:00.000+00:00 |
usage_date |
日期 | 使用量記錄的日期,此字段可用於依日期更快速匯總 | 2023-01-01 |
custom_tags |
地圖 | 與使用記錄相關聯的自定義標籤 | { “env”: “production” } |
usage_unit |
字串 | 測量此用量時所使用的單位是 | DBU |
usage_quantity |
十進制 | 此記錄所耗用的單位數目 | 259.2958 |
usage_metadata |
struct | 系統提供的使用量元數據,包括計算資源和作業的標識碼(如果適用的話)。 請參閱 使用量元資料。 | {cluster_id: null; instance_pool_id: null; notebook_id: null; job_id: null; node_type: null} |
identity_metadata |
struct | 系統提供的有關使用方式相關身分識別的元數據。 請參閱 身分識別元資料。 | 請參閱 身分識別元數據 |
record_type |
字串 | 記錄是原始的、撤銷的,還是重述。 除非記錄與更正相關,否則此值為ORIGINAL 。 請參閱 記錄類型。 |
ORIGINAL |
ingestion_date |
日期 | 記錄匯入到 usage 表格的日期 |
2024-01-01 |
billing_origin_product |
字串 | 發起使用的產品。 某些產品可以作為不同的 SKU 進行計費。 如需可能的值,請參閱 Product。 | JOBS |
product_features |
struct | 所使用特定產品功能的詳細數據。 請參閱 產品功能。 | 請參閱 產品功能 |
usage_type |
字串 | 用於計費之產品或工作負載的使用類型。 可能的值為 COMPUTE_TIME 、STORAGE_SPACE 、NETWORK_BYTES 、NETWORK_HOUR 、API_OPERATION 、TOKEN 或 GPU_TIME 。 |
STORAGE_SPACE |
使用元數據參考
usage_metadata
中的值會告訴您使用記錄中涉及的對象和資源。
值 | 資料類型 | 描述 |
---|---|---|
cluster_id |
字串 | 與使用量記錄相關聯的叢集標識碼 |
warehouse_id |
字串 | 與使用量記錄相關聯的 SQL 倉儲標識碼 |
instance_pool_id |
字串 | 與使用量記錄相關聯的實例集區標識碼 |
node_type |
字串 | 計算資源的實例類型 |
job_id |
字串 | 與使用量記錄相關聯的作業識別碼。
只傳回無伺服器計算或作業計算使用量的值,否則會傳 null 回 。 |
job_run_id |
字串 | 與使用量記錄相關聯的作業運行ID。
只傳回無伺服器計算或作業計算使用量的值,否則會傳 null 回 。 |
job_name |
字串 | 與使用量記錄相關聯的作業使用者指定名稱。
只會傳回在無伺服器計算上執行的作業值,否則會傳 null 回 。 |
notebook_id |
字串 | 與使用量相關聯的筆記本標識碼。
只有在筆記本使用中傳回無伺服器計算的值,否則傳回null 。 |
notebook_path |
字串 | 與使用量相關聯的筆記本工作區記憶體路徑。
只有在筆記本使用中,無伺服器計算才會返回值,否則會傳回 null 。 |
dlt_pipeline_id |
字串 | 與使用量記錄相關聯的 DLT 管線標識碼 |
dlt_update_id |
字串 | 與使用量記錄相關聯的 DLT 管線更新識別碼 |
dlt_maintenance_id |
字串 | 與使用記錄相關聯的 DLT 管線維護工作的標識碼 |
run_name |
字串 | 與使用記錄相關聯的基礎模型微調的唯一用戶對應標識符 |
endpoint_name |
字串 | 服務端點或向量搜尋端點的模型名稱,與使用記錄相關聯 |
endpoint_id |
字串 | 與使用記錄相關聯的模型服務端點或向量搜尋端點的標識碼 |
central_clean_room_id |
字串 | 與使用紀錄相關聯的中央無塵室識別碼 |
source_region |
字串 | 與使用量相關聯的工作區區域。 只傳回網路相關成本的值。 |
destination_region |
字串 | 正在存取之資源的區域。 只傳回網路相關成本的值。 |
metastore_id |
字串 | 與使用量記錄相關聯的中繼存放區標識碼 |
app_id |
字串 | 與使用量記錄相關聯的應用程式標識碼 |
app_name |
字串 | 與使用量記錄相關聯的應用程式使用者指定名稱 |
private_endpoint_name |
字串 | 適用的私人端點名稱。 只傳回網路相關成本的值。 |
身份識別元數據參考資料
identity_metadata
欄位提供了有關使用中涉及身分的更多資訊。 執行工作負載的人會被紀錄在 run_as
欄位中。 [owned_by
] 字段僅適用於 SQL 倉儲使用量,並記錄擁有負責使用量之 SQL 倉儲的使用者或服務主體。
此外,歸因於 Databricks Apps 的使用量會在 [identity_metadata.created_by
] 欄位中記錄值。 此值會填入建立應用程式之用戶的電子郵件。
run_as 身分識別
identity_metadata.run_as
中記錄的身分識別取決於使用相關的產品。 請參考下列表格,以了解 identity_metadata.run_as
行為:
工作負載類型 |
run_as 的身分識別 |
---|---|
任務計算 | 設定中 run_as 定義的用戶或服務主體。 根據預設,作業會以作業擁有者的身分識別執行,但系統管理員可以將此變更為其他用戶或服務主體。 |
工作任務的無伺服器運算 | 設定中 run_as 定義的用戶或服務主體。 根據預設,作業會以作業擁有者的身分識別執行,但系統管理員可以將此變更為其他用戶或服務主體。 |
筆記型電腦的無伺服器計算 | 執行筆記本命令的使用者(特別是建立筆記本會話的使用者)。 對於共用筆記本,這包括其他用戶在同一筆記本會話中的使用情況。 |
DLT 管線 | 用來執行 DLT 管線之許可權的使用者。 這可以藉由轉移管線的擁有權來更改。 |
基礎模型微調 | 發起微調訓練執行的用戶或服務主體。 |
預測性優化 | Databricks 所屬的服務主體,負責執行預測性優化作業。 |
Lakehouse 監視 | 建立監視器的使用者。 |
記錄類型參考
billing.usage
數據表支援更正。 當使用記錄的任何欄位不正確且必須修正時,就會發生更正。
發生更正時,Azure Databricks 會將兩筆新記錄新增至數據表。 撤銷記錄會否定原始不正確的記錄,然後重新整理記錄會包含更正的資訊。 更正記錄是使用 record_type
欄位來識別:
-
RETRACTION
:用來否定原始不正確的使用方式。 所有欄位都與ORIGINAL
記錄相同,但 除外usage_quantity
,這是取消原始使用量數量的負值。 例如,如果原始記錄的使用數量是259.4356
,則撤銷記錄的使用量數量-259.4356
會是 。 -
RESTATEMENT
:包含正確欄位和使用量數量的記錄。
例如,下列查詢會傳回與 job_id
相關的正確每小時使用量數量,即使已進行更正也一樣。 藉由彙總使用量,撤銷記錄會抵消原始記錄,只會傳回重述的值。
SELECT
usage_metadata.job_id, usage_start_time, usage_end_time,
SUM(usage_quantity) as usage_quantity
FROM system.billing.usage
GROUP BY ALL
HAVING usage_quantity != 0
注意
對於不應寫入原始使用記錄的更正,更正可能只會新增撤銷記錄,而沒有重新整理記錄。
計費來源產品參考
某些 Databricks 產品會以相同的共用 SKU 計費。 為了協助您區分使用量,billing_origin_product
和 product_features
數據行可讓您深入瞭解與使用量相關聯的特定產品和功能。
billing_origin_product
欄顯示與使用記錄相關聯的 Databricks 產品。 這些值包括:
JOBS
DLT
SQL
ALL_PURPOSE
MODEL_SERVING
INTERACTIVE
DEFAULT_STORAGE
VECTOR_SEARCH
LAKEHOUSE_MONITORING
PREDICTIVE_OPTIMIZATION
ONLINE_TABLES
FOUNDATION_MODEL_TRAINING
AGENT_EVALUATION
FINE_GRAIN_ACCESS_CONTROL
-
NETWORKING
:將無伺服器計算透過私人端點連接到您的資源所涉及的成本。 針對NETWORKING
使用量,workspace_id
為null
、usage_unit
為hour
,且networking.connectivity_type
為PRIVATE_IP
。 -
APPS
:與建置和執行 Databricks Apps 相關聯的成本
產品功能參考
product_features
列是一個包含使用特定產品功能信息的物件,並包括以下鍵值對:
-
jobs_tier
:值包括LIGHT
、CLASSIC
或null
-
sql_tier
:值包括CLASSIC
、PRO
或null
-
dlt_tier
:值包括CORE
、PRO
、ADVANCED
或null
-
is_serverless
:值包括true
或false
或null
-
is_photon
:值包括true
或false
或null
-
serving_type
:值包括MODEL
、GPU_MODEL
、FOUNDATION_MODEL
、FEATURE
或null
-
networking.connectivity_type
:值包括PUBLIC_IP
和PRIVATE_IP