Référence de table système d’utilisation facturable

Article
02/09/2025

Cet article fournit une présentation de la table système d’utilisation facturable, comprenant le schéma et des exemples de requêtes. Avec les tables système, les données d'utilisation facturables de votre compte sont centralisées et acheminées vers toutes les régions, afin que vous puissiez visualiser l'utilisation globale de votre compte depuis la région dans laquelle se trouve votre espace de travail.

Pour plus d’informations sur l’utilisation de ce tableau pour surveiller les coûts et les exemples de requêtes, consultez Surveiller les coûts à l’aide de tables système.

Chemin d’accès de la table : cette table système se trouve à l’emplacement system.billing.usage.

Schéma du tableau d'utilisation facturable

La table système des utilisations facturables utilise le schéma suivant :

Nom de la colonne	Type de données	Description	Exemple :
`record_id`	string	ID unique pour cet enregistrement d’utilisation	`11e22ba4-87b9-4cc2` `-9770-d10b894b7118`
`account_id`	string	ID du compte pour lequel ce rapport a été généré	`23e22ba4-87b9-4cc2` `-9770-d10b894b7118`
`workspace_id`	string	ID de l'espace de travail auquel cette utilisation était associée	`1234567890123456`
`sku_name`	string	Nom du SKU	`STANDARD_ALL_PURPOSE_COMPUTE`
`cloud`	string	Cloud pour lequel cette utilisation est pertinente. Les valeurs possibles sont `AWS`, `AZURE` et `GCP`.	`AWS`, `AZURE` ou `GCP`
`usage_start_time`	timestamp	L’heure de début pertinente pour cet enregistrement d’utilisation. Les informations de fuseau horaire sont enregistrées à la fin de la valeur, où `+00:00` représente le fuseau horaire UTC.	`2023-01-09 10:00:00.000+00:00`
`usage_end_time`	timestamp	L’heure de fin pertinente pour cet enregistrement d’utilisation. Les informations de fuseau horaire sont enregistrées à la fin de la valeur, où `+00:00` représente le fuseau horaire UTC.	`2023-01-09 11:00:00.000+00:00`
`usage_date`	date	Date de l'enregistrement d'utilisation, ce champ peut être utilisé pour une agrégation plus rapide par date	`2023-01-01`
`custom_tags`	map	Balises appliquées à cette utilisation. Inclut les balises de ressources de calcul, les balises de travail, les balises personnalisées de l’espace de travail et les balises de stratégie budgétaire.	`{ “env”: “production” }`
`usage_unit`	string	Unité dans laquelle cette utilisation est mesurée. Les valeurs possibles incluent les DBU.	`DBU`
`usage_quantity`	Décimal	Nombre d'unités consommées pour cet enregistrement.	`259.2958`
`usage_metadata`	struct	Métadonnées fournies par le système sur l'utilisation, y compris les ID des ressources de calcul et des tâches (le cas échéant). Consultez Référence des métadonnées d’utilisation.	`{cluster_id: null;` `instance_pool_id: null;` `notebook_id: null;` `job_id: null;` `node_type: null}`
`identity_metadata`	struct	Métadonnées fournies par le système sur les identités impliquées dans l’utilisation. Consultez Référence de métadonnées d’identité.	`{"run_as": example@email.com,"created_by":null}`
`record_type`	string	Indique si l’enregistrement est d’origine, une rétraction ou un repos. La valeur est `ORIGINAL` sauf si l’enregistrement est lié à une correction. Consultez la référence de type d’enregistrement .	`ORIGINAL`
`ingestion_date`	date	Date à laquelle l’enregistrement a été ingéré dans la table `usage`.	`2024-01-01`
`billing_origin_product`	string	Produit à l’origine de l’utilisation. Certains produits peuvent être facturés comme références SKU différentes. Pour connaître les valeurs possibles, consultez Référence du produit à l’origine de la facturation.	`JOBS`
`product_features`	struct	Détails sur les fonctionnalités de produit spécifiques utilisées.	Pour connaître les valeurs possibles, consultez Fonctionnalités du produit.
`usage_type`	string	Type d’utilisation attribué au produit ou à la charge de travail à des fins de facturation. Les valeurs possibles sont `COMPUTE_TIME`, `STORAGE_SPACE`, `NETWORK_BYTES`, `API_OPERATION`, `TOKEN` ou `GPU_TIME`.	`STORAGE_SPACE`

Référence de métadonnées d’utilisation

Les valeurs de usage_metadata vous renseignent sur les objets et les ressources impliqués dans l’enregistrement d’utilisation.

Valeur	Type de données	Description
`cluster_id`	string	ID du cluster associé à l’enregistrement d’utilisation
`warehouse_id`	string	ID de l’entrepôt SQL associé à l’enregistrement d’utilisation
`instance_pool_id`	string	ID du pool d’instances associé à l’enregistrement d’utilisation
`node_type`	string	Type d’instance de la ressource de calcul
`job_id`	string	ID du travail associé à l’enregistrement d’utilisation. Retourne une valeur seulement pour le calcul serverless ou l’utilisation du calcul de tâches, sinon retourne `null`.
`job_run_id`	string	ID de l’exécution du travail associée à l’enregistrement d’utilisation. Retourne une valeur seulement pour le calcul serverless ou l’utilisation du calcul de tâches, sinon retourne `null`.
`job_name`	string	Le nom que l’utilisateur à donné à la tâche associée à l’enregistrement d’utilisation. Retourne une valeur seulement pour les tâches exécutées sur un calcul serverless, sinon retourne `null`.
`notebook_id`	string	ID du notebook associé à l’utilisation. Retourne une valeur seulement pour le calcul serverless pour l’utilisation du notebook, sinon retourne `null`.
`notebook_path`	string	Chemin de stockage de l’espace de travail du notebook associé à l’utilisation. Retourne une valeur seulement pour le calcul serverless pour l’utilisation du notebook, sinon retourne `null`.
`dlt_pipeline_id`	string	ID du pipeline Delta Live Tables associé à l’enregistrement d’utilisation
`dlt_update_id`	string	ID de la mise à jour du pipeline Delta Live Tables associé à l’enregistrement d’utilisation
`dlt_maintenance_id`	string	ID des tâches de maintenance du pipeline Delta Live Tables associé à l’enregistrement d’utilisation
`run_name`	string	Identificateur unique accessible par l’utilisateur du réglage précis du modèle Foundation associé à l’enregistrement d’utilisation
`endpoint_name`	string	Nom du point de terminaison de service du modèle ou du point de terminaison de recherche vectorielle associé à l’enregistrement d’utilisation
`endpoint_id`	string	ID du point de terminaison de service du modèle ou du point de terminaison de recherche vectorielle associé à l’enregistrement d’utilisation
`central_clean_room_id`	string	ID de la salle propre centrale associée à l’enregistrement d’utilisation
`metastore_id`	string	ID de metastore associée à l’enregistrement d’utilisation.
`app_id`	string	ID de l’application associée à l’enregistrement de l’utilisation.
`app_name`	string	Nom donné par l’utilisateur à l’application associée à l’enregistrement de l’utilisation.

Référence de métadonnées d’identité

La colonne identity_metadata peut vous aider à identifier qui est responsable d’un enregistrement de facturation serverless. La colonne inclut une valeur run_as qui attribue l’utilisation à une identité.

De plus, l’utilisation attribuée aux applications Databricks enregistre une valeur dans le champ identity_metadata.created_by. Cette valeur contient l’adresse électronique de l’utilisateur qui a créé l’application.

L’identité enregistrée dans identity_metadata.run_as dépend du produit associé à l’utilisation. Référencez le tableau suivant pour le comportement identity_metadata.run_as :

Type de charge de travail	Identité de `run_as`
Jobs Compute	L’utilisateur ou le principal de service défini dans le paramètre `run_as`. Par défaut, les travaux s’exécutent en tant qu’identité du propriétaire du travail, mais les administrateurs peuvent le modifier comme un autre utilisateur ou principal de service.
Calcul serverless pour les travaux	L’utilisateur ou le principal de service défini dans le paramètre `run_as`. Par défaut, les travaux s’exécutent en tant qu’identité du propriétaire du travail, mais les administrateurs peuvent le modifier comme un autre utilisateur ou principal de service.
Calcul serverless pour les notebooks	Utilisateur qui a exécuté les commandes du notebook (en particulier, l’utilisateur qui a créé la session de notebook). Pour les notebooks partagés, cela inclut l’utilisation par d’autres utilisateurs partageant la même session de notebook.
Pipelines Delta Live Tables	Utilisateur dont les autorisations sont utilisées pour exécuter le pipeline Delta Live Tables. Cela peut être modifié en transférant la propriété du pipeline.
Réglage précis du modèle de base	L’utilisateur ou le principal de service à l’origine de l’exécution du réglage fin de la formation.
Optimisation prédictive	Le principal service qui appartient à Databricks et qui exécute les opérations d’optimisation prédictive.
Surveillance Lakehouse	L’utilisateur qui a créé le moniteur.

Référence du type d’enregistrement

Le tableau billing.usage prend en charge les corrections. Les corrections se produisent quand un champ de l’enregistrement d’utilisation est incorrect et doit être corrigé.

Lorsqu’une correction se produit, Azure Databricks ajoute deux nouveaux enregistrements à la table. Un enregistrement de rétractation annule l’enregistrement incorrect d’origine, puis un enregistrement de repos inclut les informations corrigées. Les enregistrements de correction sont identifiés à l’aide du champ record_type :

RETRACTION : utilisé pour négation de l’utilisation incorrecte d’origine. Tous les champs sont identiques à l’enregistrement ORIGINAL, à l’exception de usage_quantity, valeur négative qui annule la quantité d’utilisation d’origine. Par exemple, si la quantité d’utilisation de l’enregistrement d’origine était 259.4356, l’enregistrement de retrait aurait une quantité d’utilisation de -259.4356.
RESTATEMENT : enregistrement qui inclut les champs corrects et la quantité d’utilisation.

Par exemple, la requête suivante retourne la quantité d’utilisation horaire correcte liée à un job_id, même si des corrections ont été apportées. En agrégeant la quantité d’utilisation, l’enregistrement de rétractation annule l’enregistrement d’origine et seules les valeurs du repos sont retournées.

SELECT
  usage_metadata.job_id, usage_start_time, usage_end_time,
  SUM(usage_quantity) as usage_quantity
FROM system.billing.usage
GROUP BY ALL
HAVING usage_quantity != 0

Remarque

Pour les corrections où l’enregistrement d’utilisation d’origine n’a pas dû être écrit, une correction peut uniquement ajouter un enregistrement de rétractation et aucun enregistrement de repos.

Référence du produit à l'origine de la facturation

Certains produits Databricks sont facturés sous la même référence SKU partagée. Pour vous aider à différencier l’utilisation, les colonnes billing_origin_product et product_features fournissent plus d’informations sur le produit et les fonctionnalités spécifiques associés à l’utilisation.

La colonne billing_origin_product affiche le produit Databricks associé à l’enregistrement d’utilisation. Les valeurs incluent :

JOBS
DLT
SQL
ALL_PURPOSE
MODEL_SERVING
INTERACTIVE
DEFAULT_STORAGE
VECTOR_SEARCH
LAKEHOUSE_MONITORING
PREDICTIVE_OPTIMIZATION
ONLINE_TABLES
FOUNDATION_MODEL_TRAINING
AGENT_EVALUATION
FINE_GRAIN_ACCESS_CONTROL
APPS: Coûts associés à la création et à l’exécution des Applications Databricks

Référence des fonctionnalités du produit

La colonne product_features est un objet contenant des informations sur les fonctionnalités de produit spécifiques utilisées et inclut les paires clé/valeur suivantes :

jobs_tier : les valeurs incluent LIGHT, CLASSIC ou null
sql_tier : les valeurs incluent CLASSIC, PRO ou null
dlt_tier : les valeurs incluent CORE, PRO, ADVANCED ou null
is_serverless : les valeurs incluent true ou false, ou null
is_photon : les valeurs incluent true ou false, ou null
serving_type : les valeurs incluent MODEL, GPU_MODEL, FOUNDATION_MODEL, FEATUREou null

Partager via