Référence de table système d’utilisation facturable
Cet article fournit une présentation de la table système d’utilisation facturable, comprenant le schéma et des exemples de requêtes. Avec les tables système, les données d'utilisation facturables de votre compte sont centralisées et acheminées vers toutes les régions, afin que vous puissiez visualiser l'utilisation globale de votre compte depuis la région dans laquelle se trouve votre espace de travail.
Pour plus d’informations sur l’utilisation de ce tableau pour surveiller les coûts et les exemples de requêtes, consultez Surveiller les coûts à l’aide de tables système.
Chemin d’accès de la table : cette table système se trouve à l’emplacement system.billing.usage
.
Schéma du tableau d'utilisation facturable
La table système des utilisations facturables utilise le schéma suivant :
Nom de la colonne | Type de données | Description | Exemple : |
---|---|---|---|
record_id |
string | ID unique pour cet enregistrement d’utilisation | 11e22ba4-87b9-4cc2 -9770-d10b894b7118 |
account_id |
string | ID du compte pour lequel ce rapport a été généré | 23e22ba4-87b9-4cc2 -9770-d10b894b7118 |
workspace_id |
string | ID de l'espace de travail auquel cette utilisation était associée | 1234567890123456 |
sku_name |
string | Nom du SKU | STANDARD_ALL_PURPOSE_COMPUTE |
cloud |
string | Cloud pour lequel cette utilisation est pertinente. Les valeurs possibles sont AWS , AZURE et GCP . |
AWS , AZURE ou GCP |
usage_start_time |
timestamp | L’heure de début pertinente pour cet enregistrement d’utilisation. Les informations de fuseau horaire sont enregistrées à la fin de la valeur, où +00:00 représente le fuseau horaire UTC. |
2023-01-09 10:00:00.000+00:00 |
usage_end_time |
timestamp | L’heure de fin pertinente pour cet enregistrement d’utilisation. Les informations de fuseau horaire sont enregistrées à la fin de la valeur, où +00:00 représente le fuseau horaire UTC. |
2023-01-09 11:00:00.000+00:00 |
usage_date |
date | Date de l'enregistrement d'utilisation, ce champ peut être utilisé pour une agrégation plus rapide par date | 2023-01-01 |
custom_tags |
map | Balises appliquées à cette utilisation. Inclut les balises de ressources de calcul, les balises de travail, les balises personnalisées de l’espace de travail et les balises de stratégie budgétaire. | { “env”: “production” } |
usage_unit |
string | Unité dans laquelle cette utilisation est mesurée. Les valeurs possibles incluent les DBU. | DBU |
usage_quantity |
Décimal | Nombre d'unités consommées pour cet enregistrement. | 259.2958 |
usage_metadata |
struct | Métadonnées fournies par le système sur l'utilisation, y compris les ID des ressources de calcul et des tâches (le cas échéant). Consultez Référence des métadonnées d’utilisation. | {cluster_id: null; instance_pool_id: null; notebook_id: null; job_id: null; node_type: null} |
identity_metadata |
struct | Métadonnées fournies par le système sur les identités impliquées dans l’utilisation. Consultez Référence de métadonnées d’identité. | {"run_as": example@email.com,"created_by":null} |
record_type |
string | Indique si l’enregistrement est d’origine, une rétraction ou un repos. La valeur est ORIGINAL sauf si l’enregistrement est lié à une correction. Consultez la référence de type d’enregistrement . |
ORIGINAL |
ingestion_date |
date | Date à laquelle l’enregistrement a été ingéré dans la table usage . |
2024-01-01 |
billing_origin_product |
string | Produit à l’origine de l’utilisation. Certains produits peuvent être facturés comme références SKU différentes. Pour connaître les valeurs possibles, consultez Référence du produit à l’origine de la facturation. | JOBS |
product_features |
struct | Détails sur les fonctionnalités de produit spécifiques utilisées. | Pour connaître les valeurs possibles, consultez Fonctionnalités du produit. |
usage_type |
string | Type d’utilisation attribué au produit ou à la charge de travail à des fins de facturation. Les valeurs possibles sont COMPUTE_TIME , STORAGE_SPACE , NETWORK_BYTES , API_OPERATION , TOKEN ou GPU_TIME . |
STORAGE_SPACE |
Référence de métadonnées d’utilisation
Les valeurs de usage_metadata
vous renseignent sur les objets et les ressources impliqués dans l’enregistrement d’utilisation.
Valeur | Type de données | Description |
---|---|---|
cluster_id |
string | ID du cluster associé à l’enregistrement d’utilisation |
warehouse_id |
string | ID de l’entrepôt SQL associé à l’enregistrement d’utilisation |
instance_pool_id |
string | ID du pool d’instances associé à l’enregistrement d’utilisation |
node_type |
string | Type d’instance de la ressource de calcul |
job_id |
string | ID du travail associé à l’enregistrement d’utilisation. Retourne une valeur seulement pour le calcul serverless ou l’utilisation du calcul de tâches, sinon retourne null . |
job_run_id |
string | ID de l’exécution du travail associée à l’enregistrement d’utilisation. Retourne une valeur seulement pour le calcul serverless ou l’utilisation du calcul de tâches, sinon retourne null . |
job_name |
string | Le nom que l’utilisateur à donné à la tâche associée à l’enregistrement d’utilisation. Retourne une valeur seulement pour les tâches exécutées sur un calcul serverless, sinon retourne null . |
notebook_id |
string | ID du notebook associé à l’utilisation. Retourne une valeur seulement pour le calcul serverless pour l’utilisation du notebook, sinon retourne null . |
notebook_path |
string | Chemin de stockage de l’espace de travail du notebook associé à l’utilisation. Retourne une valeur seulement pour le calcul serverless pour l’utilisation du notebook, sinon retourne null . |
dlt_pipeline_id |
string | ID du pipeline Delta Live Tables associé à l’enregistrement d’utilisation |
dlt_update_id |
string | ID de la mise à jour du pipeline Delta Live Tables associé à l’enregistrement d’utilisation |
dlt_maintenance_id |
string | ID des tâches de maintenance du pipeline Delta Live Tables associé à l’enregistrement d’utilisation |
run_name |
string | Identificateur unique accessible par l’utilisateur du réglage précis du modèle Foundation associé à l’enregistrement d’utilisation |
endpoint_name |
string | Nom du point de terminaison de service du modèle ou du point de terminaison de recherche vectorielle associé à l’enregistrement d’utilisation |
endpoint_id |
string | ID du point de terminaison de service du modèle ou du point de terminaison de recherche vectorielle associé à l’enregistrement d’utilisation |
central_clean_room_id |
string | ID de la salle propre centrale associée à l’enregistrement d’utilisation |
metastore_id |
string | ID de metastore associée à l’enregistrement d’utilisation. |
app_id |
string | ID de l’application associée à l’enregistrement de l’utilisation. |
app_name |
string | Nom donné par l’utilisateur à l’application associée à l’enregistrement de l’utilisation. |
Référence de métadonnées d’identité
La colonne identity_metadata
peut vous aider à identifier qui est responsable d’un enregistrement de facturation serverless. La colonne inclut une valeur run_as
qui attribue l’utilisation à une identité.
De plus, l’utilisation attribuée aux applications Databricks enregistre une valeur dans le champ identity_metadata.created_by
. Cette valeur contient l’adresse électronique de l’utilisateur qui a créé l’application.
L’identité enregistrée dans identity_metadata.run_as
dépend du produit associé à l’utilisation. Référencez le tableau suivant pour le comportement identity_metadata.run_as
:
Type de charge de travail | Identité de run_as |
---|---|
Jobs Compute | L’utilisateur ou le principal de service défini dans le paramètre run_as . Par défaut, les travaux s’exécutent en tant qu’identité du propriétaire du travail, mais les administrateurs peuvent le modifier comme un autre utilisateur ou principal de service. |
Calcul serverless pour les travaux | L’utilisateur ou le principal de service défini dans le paramètre run_as . Par défaut, les travaux s’exécutent en tant qu’identité du propriétaire du travail, mais les administrateurs peuvent le modifier comme un autre utilisateur ou principal de service. |
Calcul serverless pour les notebooks | Utilisateur qui a exécuté les commandes du notebook (en particulier, l’utilisateur qui a créé la session de notebook). Pour les notebooks partagés, cela inclut l’utilisation par d’autres utilisateurs partageant la même session de notebook. |
Pipelines Delta Live Tables | Utilisateur dont les autorisations sont utilisées pour exécuter le pipeline Delta Live Tables. Cela peut être modifié en transférant la propriété du pipeline. |
Réglage précis du modèle de base | L’utilisateur ou le principal de service à l’origine de l’exécution du réglage fin de la formation. |
Optimisation prédictive | Le principal service qui appartient à Databricks et qui exécute les opérations d’optimisation prédictive. |
Surveillance Lakehouse | L’utilisateur qui a créé le moniteur. |
Référence du type d’enregistrement
Le tableau billing.usage
prend en charge les corrections. Les corrections se produisent quand un champ de l’enregistrement d’utilisation est incorrect et doit être corrigé.
Lorsqu’une correction se produit, Azure Databricks ajoute deux nouveaux enregistrements à la table. Un enregistrement de rétractation annule l’enregistrement incorrect d’origine, puis un enregistrement de repos inclut les informations corrigées. Les enregistrements de correction sont identifiés à l’aide du champ record_type
:
RETRACTION
: utilisé pour négation de l’utilisation incorrecte d’origine. Tous les champs sont identiques à l’enregistrementORIGINAL
, à l’exception deusage_quantity
, valeur négative qui annule la quantité d’utilisation d’origine. Par exemple, si la quantité d’utilisation de l’enregistrement d’origine était259.4356
, l’enregistrement de retrait aurait une quantité d’utilisation de-259.4356
.RESTATEMENT
: enregistrement qui inclut les champs corrects et la quantité d’utilisation.
Par exemple, la requête suivante retourne la quantité d’utilisation horaire correcte liée à un job_id
, même si des corrections ont été apportées. En agrégeant la quantité d’utilisation, l’enregistrement de rétractation annule l’enregistrement d’origine et seules les valeurs du repos sont retournées.
SELECT
usage_metadata.job_id, usage_start_time, usage_end_time,
SUM(usage_quantity) as usage_quantity
FROM system.billing.usage
GROUP BY ALL
HAVING usage_quantity != 0
Remarque
Pour les corrections où l’enregistrement d’utilisation d’origine n’a pas dû être écrit, une correction peut uniquement ajouter un enregistrement de rétractation et aucun enregistrement de repos.
Référence du produit à l'origine de la facturation
Certains produits Databricks sont facturés sous la même référence SKU partagée. Pour vous aider à différencier l’utilisation, les colonnes billing_origin_product
et product_features
fournissent plus d’informations sur le produit et les fonctionnalités spécifiques associés à l’utilisation.
La colonne billing_origin_product
affiche le produit Databricks associé à l’enregistrement d’utilisation. Les valeurs incluent :
JOBS
DLT
SQL
ALL_PURPOSE
MODEL_SERVING
INTERACTIVE
DEFAULT_STORAGE
VECTOR_SEARCH
LAKEHOUSE_MONITORING
PREDICTIVE_OPTIMIZATION
ONLINE_TABLES
FOUNDATION_MODEL_TRAINING
AGENT_EVALUATION
FINE_GRAIN_ACCESS_CONTROL
APPS
: Coûts associés à la création et à l’exécution des Applications Databricks
Référence des fonctionnalités du produit
La colonne product_features
est un objet contenant des informations sur les fonctionnalités de produit spécifiques utilisées et inclut les paires clé/valeur suivantes :
jobs_tier
: les valeurs incluentLIGHT
,CLASSIC
ounull
sql_tier
: les valeurs incluentCLASSIC
,PRO
ounull
dlt_tier
: les valeurs incluentCORE
,PRO
,ADVANCED
ounull
is_serverless
: les valeurs incluenttrue
oufalse
, ounull
is_photon
: les valeurs incluenttrue
oufalse
, ounull
serving_type
: les valeurs incluentMODEL
,GPU_MODEL
,FOUNDATION_MODEL
,FEATURE
ounull