Informazioni di riferimento sulla tabella del sistema di utilizzo fatturabile

Articolo
02/27/2025

Questo articolo fornisce una panoramica della tabella del sistema di utilizzo fatturabile, inclusi lo schema e le query di esempio. Con le tabelle di sistema, i dati di utilizzo fatturabili dell'account sono centralizzati e indirizzati a tutte le aree, in modo da poter visualizzare l'utilizzo globale dell'account da qualsiasi area in cui si trova l'area di lavoro.

Per informazioni sull'uso di questa tabella per monitorare i costi e le query di esempio, vedere Monitorare i costi usando le tabelle di sistema.

percorso tabella: questa tabella di sistema si trova in system.billing.usage.

Schema della tabella di utilizzo fatturabile

La tabella del sistema di utilizzo fatturabile usa lo schema seguente:

Nome colonna	Tipo di dati	Descrizione	Esempio
`record_id`	string	ID univoco per questo record di utilizzo	`11e22ba4-87b9-4cc2-9770-d10b894b7118`
`account_id`	string	ID dell'account per cui è stato generato il report	`23e22ba4-87b9-4cc2-9770-d10b894b7118`
`workspace_id`	string	ID dell'area di lavoro a cui è stato associato questo utilizzo	`1234567890123456`
`sku_name`	string	Nome dello SKU	`STANDARD_ALL_PURPOSE_COMPUTE`
`cloud`	string	Cloud associato a questo utilizzo. I valori possibili sono `AWS`, `AZURE`e `GCP`.	`AWS`, `AZURE` o `GCP`
`usage_start_time`	timestamp	Ora di inizio relativa a questo record di utilizzo. Le informazioni sul fuso orario vengono registrate alla fine del valore con `+00:00` che rappresenta il fuso orario UTC.	`2023-01-09 10:00:00.000+00:00`
`usage_end_time`	timestamp	Ora di fine relativa a questo record di utilizzo. Le informazioni sul fuso orario vengono registrate alla fine del valore con `+00:00` che rappresenta il fuso orario UTC.	`2023-01-09 11:00:00.000+00:00`
`usage_date`	data	Data del record di utilizzo, questo campo può essere usato per un'aggregazione più veloce per data	`2023-01-01`
`custom_tags`	mappa	Tag personalizzati associati al record di utilizzo	`{ “env”: “production” }`
`usage_unit`	string	Unità in cui viene misurato questo utilizzo	`DBU`
`usage_quantity`	decimale	Numero di unità utilizzate per questo record	`259.2958`
`usage_metadata`	struttura	Metadati forniti dal sistema relativi all'utilizzo, inclusi gli ID per le risorse di calcolo e i processi (se applicabile). Consultare metadati di utilizzo.	`{cluster_id: null; instance_pool_id: null; notebook_id: null; job_id: null; node_type: null}`
`identity_metadata`	struttura	Metadati forniti dal sistema sulle identità coinvolte nell'utilizzo. Vedere Identity Metadata.	Fare riferimento ai metadati sull'identità
`record_type`	string	Se il record è originale, una ritrattazione o una riformulazione. Il valore è `ORIGINAL` a meno che il record non sia correlato a una correzione. Vedi Tipo di record.	`ORIGINAL`
`ingestion_date`	data	Data di inserimento del record nella tabella `usage`	`2024-01-01`
`billing_origin_product`	string	Prodotto che ha originato l'utilizzo. Alcuni prodotti possono essere fatturati come SKU diversi. Per i valori possibili, vedere Product.	`JOBS`
`product_features`	struct	Informazioni dettagliate sulle funzionalità specifiche del prodotto usate. Vedere Funzionalità del prodotto.	Vedere funzionalità del prodotto
`usage_type`	string	Tipo di utilizzo attribuito al prodotto o al carico di lavoro a scopo di fatturazione. I valori possibili sono `COMPUTE_TIME`, `STORAGE_SPACE`, `NETWORK_BYTES`, `NETWORK_HOUR`, `API_OPERATION`, `TOKEN`o `GPU_TIME`.	`STORAGE_SPACE`

Informazioni di riferimento sui metadati di utilizzo

I valori in usage_metadata indicano gli oggetti e le risorse coinvolti nel record di utilizzo.

Valore	Tipo di dati	Descrizione
`cluster_id`	string	ID del cluster associato al record di utilizzo
`warehouse_id`	string	ID del warehouse SQL associato al record di utilizzo
`instance_pool_id`	string	ID del pool di istanze associato al record di utilizzo
`node_type`	string	Tipo di istanza della risorsa di calcolo
`job_id`	string	ID del processo associato al record di utilizzo. Restituisce un valore solo per l'utilizzo del calcolo serverless o del calcolo dei processi, altrimenti restituisce `null`.
`job_run_id`	string	ID dell'esecuzione del processo associata al record di utilizzo. Restituisce un valore solo per l'utilizzo di calcolo serverless o per job, altrimenti restituisce `null`.
`job_name`	string	Nome specificato dall'utente del lavoro associato al record di utilizzo. Restituisce solo un valore per i processi eseguiti in un ambiente di calcolo serverless. In caso contrario, restituisce `null`.
`notebook_id`	string	ID del notebook associato all'utilizzo. Restituisce solo un valore per il calcolo serverless per l'utilizzo del notebook. In caso contrario, restituisce `null`.
`notebook_path`	string	Percorso di archiviazione dell'area di lavoro del notebook associato all'utilizzo. Restituisce solo un valore per il calcolo serverless per l'utilizzo del notebook. In caso contrario, restituisce `null`.
`dlt_pipeline_id`	string	ID della pipeline DLT associata al record di utilizzo
`dlt_update_id`	string	ID dell'aggiornamento della pipeline DLT associato al record di utilizzo
`dlt_maintenance_id`	string	ID delle attività di manutenzione della DLT pipeline associate al record di utilizzo
`run_name`	string	Identificatore univoco orientato all'utente della messa a punto del modello di base associato al record di utilizzo
`endpoint_name`	string	Nome del modello che gestisce l'endpoint o l'endpoint di ricerca vettoriale associato al record di utilizzo
`endpoint_id`	string	ID del modello che gestisce l'endpoint o l'endpoint di ricerca vettoriale associato al record di utilizzo
`central_clean_room_id`	string	ID della stanza pulita centrale associata al record di utilizzo
`source_region`	string	Area dell'area di lavoro associata all'utilizzo. restituisce solo un valore per i costi correlati alla rete.
`destination_region`	string	Area della risorsa a cui si accede. restituisce solo un valore per i costi correlati alla rete.
`metastore_id`	string	ID del metastore associato al record di utilizzo
`app_id`	string	ID dell'app associata al record di utilizzo
`app_name`	string	Nome specificato dall'utente dell'app associata al record di utilizzo
`private_endpoint_name`	string	Nome dell'endpoint privato applicabile. restituisce solo un valore per i costi correlati alla rete.

Riferimento ai metadati di identità

La colonna identity_metadata fornisce altre informazioni sulle identità coinvolte nell'utilizzo. Il campo run_as registra chi ha eseguito il carico di lavoro. Il campo owned_by si applica solo all'utilizzo di SQL Warehouse e registra l'utente o l'entità servizio proprietaria del warehouse SQL responsabile dell'utilizzo.

Inoltre, l'utilizzo attribuito alle applicazioni Databricks registra un valore nel campo identity_metadata.created_by. Questo valore viene popolato con l'indirizzo di posta elettronica dell'utente che ha creato l'app.

identità run_as

L'identità registrata in identity_metadata.run_as dipende dal prodotto associato all'utilizzo. Fare riferimento alla tabella seguente per il comportamento di identity_metadata.run_as:

Tipo di carico di lavoro	Identità di `run_as`
Elaborazione dei lavori	L'utente o l'entità servizio definita nella impostazione `run_as`. Per impostazione predefinita, i processi vengono eseguiti con l'identità del proprietario del processo, ma gli amministratori possono modificarli in modo che siano un altro utente o un principale del servizio.
Calcolo serverless per le attività	L'utente o il principale di servizio definito nelle impostazioni `run_as`. Per impostazione predefinita, i processi vengono eseguiti con l'identità del proprietario del processo, ma gli amministratori possono modificare questa impostazione per utilizzare un altro utente o un'entità servizio.
Calcolo serverless per notebook	L'utente che ha eseguito i comandi del notebook( in particolare l'utente che ha creato la sessione del notebook). Per i notebook condivisi, questo include l'utilizzo da parte di altri utenti che condividono la stessa sessione del notebook.
Pipeline DLT	Utente le cui autorizzazioni vengono usate per eseguire la pipeline DLT. Questa operazione può essere modificata trasferendo la proprietà della pipeline.
Ottimizzazione del modello di base	L'utente o l'entità servizio che ha avviato l'esecuzione del training di ottimizzazione.
Ottimizzazione predittiva	Il principale del servizio di Databricks che esegue operazioni di ottimizzazione predittiva.
Monitoraggio di Lakehouse	L'utente che ha creato il monitor.

Riferimento al tipo di record

La tabella billing.usage supporta le correzioni. Le correzioni si verificano quando un campo del record di utilizzo non è corretto e deve essere corretto.

Quando si verifica una correzione, Azure Databricks aggiunge due nuovi record alla tabella. Un record di ritiro nega il record originale non corretto, quindi un record di riformazione include le informazioni corrette. I record di correzione vengono identificati usando il record_type campo :

RETRACTION: usato per negare l'utilizzo non corretto originale. Tutti i campi sono identici al ORIGINAL record tranne usage_quantity, ovvero un valore negativo che annulla la quantità di utilizzo originale. Ad esempio, se la quantità di utilizzo del record originale era 259.4356, il record di ritiro avrebbe una quantità di utilizzo pari -259.4356a .
RESTATEMENT: record che include i campi e la quantità di utilizzo corretti.

Ad esempio, la query seguente restituisce la quantità di utilizzo orario corretta correlata a un job_idoggetto , anche se sono state apportate correzioni. Aggregando la quantità di utilizzo, il record di storno annulla il record originale e vengono restituiti solo i valori della rettifica.

SELECT
  usage_metadata.job_id, usage_start_time, usage_end_time,
  SUM(usage_quantity) as usage_quantity
FROM system.billing.usage
GROUP BY ALL
HAVING usage_quantity != 0

Nota

Per le correzioni in cui il record di utilizzo originale non avrebbe dovuto essere scritto, una correzione può aggiungere solo un record di revoca e nessun record di ristabilimento.

informazioni di riferimento sul prodotto origine fatturazione

Alcuni prodotti Databricks vengono fatturati con lo stesso SKU condiviso. Per facilitare la differenziazione dell'utilizzo, le colonne billing_origin_product e product_features forniscono maggiori informazioni dettagliate sul prodotto e sulle funzionalità specifiche associate all'utilizzo.

La colonna billing_origin_product mostra il prodotto Databricks associato al record di utilizzo. I valori includono:

JOBS
DLT
SQL
ALL_PURPOSE
MODEL_SERVING
INTERACTIVE
DEFAULT_STORAGE
VECTOR_SEARCH
LAKEHOUSE_MONITORING
PREDICTIVE_OPTIMIZATION
ONLINE_TABLES
FOUNDATION_MODEL_TRAINING
AGENT_EVALUATION
FINE_GRAIN_ACCESS_CONTROL

NETWORKING: Costi associati alla connessione dei servizi serverless alle risorse tramite endpoint privati. Per l'utilizzo di NETWORKING, workspace_id è null, usage_unit è houre networking.connectivity_type è PRIVATE_IP.
APPS: costi associati allo sviluppo e gestione delle App di Databricks

Informazioni di riferimento sulle funzionalità del prodotto

La colonna product_features è un oggetto contenente informazioni sulle funzionalità specifiche del prodotto usate e include le coppie chiave/valore seguenti:

jobs_tier: i valori includono LIGHT, CLASSICo null
sql_tier: i valori includono CLASSIC, PROo null
dlt_tier: i valori includono CORE, PRO, ADVANCEDo null
is_serverless: i valori includono true o falseo null
is_photon: i valori includono true o falseo null
serving_type: i valori includono MODEL, GPU_MODEL, FOUNDATION_MODEL, FEATUREo null

networking.connectivity_type: i valori includono PUBLIC_IP e PRIVATE_IP

Condividi tramite