Partager via


Référence de table système d’utilisation facturable

Cet article fournit une présentation de la table système d’utilisation facturable, comprenant le schéma et des exemples de requêtes. Avec les tables système, les données d'utilisation facturables de votre compte sont centralisées et acheminées vers toutes les régions, afin que vous puissiez visualiser l'utilisation globale de votre compte depuis la région dans laquelle se trouve votre espace de travail.

Pour plus d’informations sur l’utilisation de ce tableau pour surveiller les coûts et les exemples de requêtes, consultez Surveiller les coûts à l’aide de tables système.

Chemin d’accès de la table : cette table système se trouve à l’emplacement system.billing.usage.

Schéma du tableau d'utilisation facturable

La table système des utilisations facturables utilise le schéma suivant :

Nom de la colonne Type de données Description Exemple :
record_id string ID unique pour cet enregistrement d’utilisation 11e22ba4-87b9-4cc2
-9770-d10b894b7118
account_id string ID du compte pour lequel ce rapport a été généré 23e22ba4-87b9-4cc2
-9770-d10b894b7118
workspace_id string ID de l'espace de travail auquel cette utilisation était associée 1234567890123456
sku_name string Nom du SKU STANDARD_ALL_PURPOSE_COMPUTE
cloud string Cloud pour lequel cette utilisation est pertinente. Les valeurs possibles sont AWS, AZURE et GCP. AWS, AZURE ou GCP
usage_start_time timestamp L’heure de début pertinente pour cet enregistrement d’utilisation. Les informations de fuseau horaire sont enregistrées à la fin de la valeur, où +00:00 représente le fuseau horaire UTC. 2023-01-09 10:00:00.000+00:00
usage_end_time timestamp L’heure de fin pertinente pour cet enregistrement d’utilisation. Les informations de fuseau horaire sont enregistrées à la fin de la valeur, où +00:00 représente le fuseau horaire UTC. 2023-01-09 11:00:00.000+00:00
usage_date date Date de l'enregistrement d'utilisation, ce champ peut être utilisé pour une agrégation plus rapide par date 2023-01-01
custom_tags map Balises appliquées à cette utilisation. Inclut les balises de ressources de calcul, les balises de travail, les balises personnalisées de l’espace de travail et les balises de stratégie budgétaire. { “env”: “production” }
usage_unit string Unité dans laquelle cette utilisation est mesurée. Les valeurs possibles incluent les DBU. DBU
usage_quantity Décimal Nombre d'unités consommées pour cet enregistrement. 259.2958
usage_metadata struct Métadonnées fournies par le système sur l'utilisation, y compris les ID des ressources de calcul et des tâches (le cas échéant). Consultez Référence des métadonnées d’utilisation. {cluster_id: null;
instance_pool_id: null;
notebook_id: null;
job_id: null;
node_type: null}
identity_metadata struct Métadonnées fournies par le système sur les identités impliquées dans l’utilisation. Consultez Référence de métadonnées d’identité. {"run_as": example@email.com,"created_by":null}
record_type string Indique si l’enregistrement est d’origine, une rétraction ou un repos. La valeur est ORIGINAL sauf si l’enregistrement est lié à une correction. Consultez la référence de type d’enregistrement . ORIGINAL
ingestion_date date Date à laquelle l’enregistrement a été ingéré dans la table usage. 2024-01-01
billing_origin_product string Produit à l’origine de l’utilisation. Certains produits peuvent être facturés comme références SKU différentes. Pour connaître les valeurs possibles, consultez Référence du produit à l’origine de la facturation. JOBS
product_features struct Détails sur les fonctionnalités de produit spécifiques utilisées. Pour connaître les valeurs possibles, consultez Fonctionnalités du produit.
usage_type string Type d’utilisation attribué au produit ou à la charge de travail à des fins de facturation. Les valeurs possibles sont COMPUTE_TIME, STORAGE_SPACE, NETWORK_BYTES, API_OPERATION, TOKEN ou GPU_TIME. STORAGE_SPACE

Référence de métadonnées d’utilisation

Les valeurs de usage_metadata vous renseignent sur les objets et les ressources impliqués dans l’enregistrement d’utilisation.

Valeur Type de données Description
cluster_id string ID du cluster associé à l’enregistrement d’utilisation
warehouse_id string ID de l’entrepôt SQL associé à l’enregistrement d’utilisation
instance_pool_id string ID du pool d’instances associé à l’enregistrement d’utilisation
node_type string Type d’instance de la ressource de calcul
job_id string ID du travail associé à l’enregistrement d’utilisation. Retourne une valeur seulement pour le calcul serverless ou l’utilisation du calcul de tâches, sinon retourne null.
job_run_id string ID de l’exécution du travail associée à l’enregistrement d’utilisation. Retourne une valeur seulement pour le calcul serverless ou l’utilisation du calcul de tâches, sinon retourne null.
job_name string Le nom que l’utilisateur à donné à la tâche associée à l’enregistrement d’utilisation. Retourne une valeur seulement pour les tâches exécutées sur un calcul serverless, sinon retourne null.
notebook_id string ID du notebook associé à l’utilisation. Retourne une valeur seulement pour le calcul serverless pour l’utilisation du notebook, sinon retourne null.
notebook_path string Chemin de stockage de l’espace de travail du notebook associé à l’utilisation. Retourne une valeur seulement pour le calcul serverless pour l’utilisation du notebook, sinon retourne null.
dlt_pipeline_id string ID du pipeline Delta Live Tables associé à l’enregistrement d’utilisation
dlt_update_id string ID de la mise à jour du pipeline Delta Live Tables associé à l’enregistrement d’utilisation
dlt_maintenance_id string ID des tâches de maintenance du pipeline Delta Live Tables associé à l’enregistrement d’utilisation
run_name string Identificateur unique accessible par l’utilisateur du réglage précis du modèle Foundation associé à l’enregistrement d’utilisation
endpoint_name string Nom du point de terminaison de service du modèle ou du point de terminaison de recherche vectorielle associé à l’enregistrement d’utilisation
endpoint_id string ID du point de terminaison de service du modèle ou du point de terminaison de recherche vectorielle associé à l’enregistrement d’utilisation
central_clean_room_id string ID de la salle propre centrale associée à l’enregistrement d’utilisation
metastore_id string ID de metastore associée à l’enregistrement d’utilisation.
app_id string ID de l’application associée à l’enregistrement de l’utilisation.
app_name string Nom donné par l’utilisateur à l’application associée à l’enregistrement de l’utilisation.

Référence de métadonnées d’identité

La colonne identity_metadata peut vous aider à identifier qui est responsable d’un enregistrement de facturation serverless. La colonne inclut une valeur run_as qui attribue l’utilisation à une identité.

De plus, l’utilisation attribuée aux applications Databricks enregistre une valeur dans le champ identity_metadata.created_by. Cette valeur contient l’adresse électronique de l’utilisateur qui a créé l’application.

L’identité enregistrée dans identity_metadata.run_as dépend du produit associé à l’utilisation. Référencez le tableau suivant pour le comportement identity_metadata.run_as :

Type de charge de travail Identité de run_as
Jobs Compute L’utilisateur ou le principal de service défini dans le paramètre run_as. Par défaut, les travaux s’exécutent en tant qu’identité du propriétaire du travail, mais les administrateurs peuvent le modifier comme un autre utilisateur ou principal de service.
Calcul serverless pour les travaux L’utilisateur ou le principal de service défini dans le paramètre run_as. Par défaut, les travaux s’exécutent en tant qu’identité du propriétaire du travail, mais les administrateurs peuvent le modifier comme un autre utilisateur ou principal de service.
Calcul serverless pour les notebooks Utilisateur qui a exécuté les commandes du notebook (en particulier, l’utilisateur qui a créé la session de notebook). Pour les notebooks partagés, cela inclut l’utilisation par d’autres utilisateurs partageant la même session de notebook.
Pipelines Delta Live Tables Utilisateur dont les autorisations sont utilisées pour exécuter le pipeline Delta Live Tables. Cela peut être modifié en transférant la propriété du pipeline.
Réglage précis du modèle de base L’utilisateur ou le principal de service à l’origine de l’exécution du réglage fin de la formation.
Optimisation prédictive Le principal service qui appartient à Databricks et qui exécute les opérations d’optimisation prédictive.
Surveillance Lakehouse L’utilisateur qui a créé le moniteur.

Référence du type d’enregistrement

Le tableau billing.usage prend en charge les corrections. Les corrections se produisent quand un champ de l’enregistrement d’utilisation est incorrect et doit être corrigé.

Lorsqu’une correction se produit, Azure Databricks ajoute deux nouveaux enregistrements à la table. Un enregistrement de rétractation annule l’enregistrement incorrect d’origine, puis un enregistrement de repos inclut les informations corrigées. Les enregistrements de correction sont identifiés à l’aide du champ record_type :

  • RETRACTION : utilisé pour négation de l’utilisation incorrecte d’origine. Tous les champs sont identiques à l’enregistrement ORIGINAL, à l’exception de usage_quantity, valeur négative qui annule la quantité d’utilisation d’origine. Par exemple, si la quantité d’utilisation de l’enregistrement d’origine était 259.4356, l’enregistrement de retrait aurait une quantité d’utilisation de -259.4356.
  • RESTATEMENT : enregistrement qui inclut les champs corrects et la quantité d’utilisation.

Par exemple, la requête suivante retourne la quantité d’utilisation horaire correcte liée à un job_id, même si des corrections ont été apportées. En agrégeant la quantité d’utilisation, l’enregistrement de rétractation annule l’enregistrement d’origine et seules les valeurs du repos sont retournées.

SELECT
  usage_metadata.job_id, usage_start_time, usage_end_time,
  SUM(usage_quantity) as usage_quantity
FROM system.billing.usage
GROUP BY ALL
HAVING usage_quantity != 0

Remarque

Pour les corrections où l’enregistrement d’utilisation d’origine n’a pas dû être écrit, une correction peut uniquement ajouter un enregistrement de rétractation et aucun enregistrement de repos.

Référence du produit à l'origine de la facturation

Certains produits Databricks sont facturés sous la même référence SKU partagée. Pour vous aider à différencier l’utilisation, les colonnes billing_origin_product et product_features fournissent plus d’informations sur le produit et les fonctionnalités spécifiques associés à l’utilisation.

La colonne billing_origin_product affiche le produit Databricks associé à l’enregistrement d’utilisation. Les valeurs incluent :

  • JOBS

  • DLT

  • SQL

  • ALL_PURPOSE

  • MODEL_SERVING

  • INTERACTIVE

  • DEFAULT_STORAGE

  • VECTOR_SEARCH

  • LAKEHOUSE_MONITORING

  • PREDICTIVE_OPTIMIZATION

  • ONLINE_TABLES

  • FOUNDATION_MODEL_TRAINING

  • AGENT_EVALUATION

  • FINE_GRAIN_ACCESS_CONTROL

  • APPS: Coûts associés à la création et à l’exécution des Applications Databricks

Référence des fonctionnalités du produit

La colonne product_features est un objet contenant des informations sur les fonctionnalités de produit spécifiques utilisées et inclut les paires clé/valeur suivantes :

  • jobs_tier : les valeurs incluent LIGHT, CLASSIC ou null
  • sql_tier : les valeurs incluent CLASSIC, PRO ou null
  • dlt_tier : les valeurs incluent CORE, PRO, ADVANCED ou null
  • is_serverless : les valeurs incluent true ou false, ou null
  • is_photon : les valeurs incluent true ou false, ou null
  • serving_type : les valeurs incluent MODEL, GPU_MODEL, FOUNDATION_MODEL, FEATUREou null