Referentie voor factureerbare systeemtabelgebruik
Dit artikel bevat een overzicht van de factureerbare gebruikssysteemtabel, inclusief het schema en voorbeeldquery's. Met systeemtabellen worden de factureerbare gebruiksgegevens van uw account gecentraliseerd en doorgestuurd naar alle regio's, zodat u het globale gebruik van uw account kunt bekijken vanuit de regio waarin uw werkruimte zich bevindt.
Zie Kosten bewaken met behulp van systeemtabellenvoor meer informatie over het gebruik van deze tabel voor het bewaken van kosten en voorbeeldquery's.
tabelpad: deze systeemtabel bevindt zich op system.billing.usage
.
Factureerbare gebruikstabelschema
De tabel voor het factureringssysteem van gebruik maakt gebruik van het volgende schema:
Kolomnaam | Gegevenstype | Beschrijving | Voorbeeld |
---|---|---|---|
record_id |
tekenreeks | Unieke id voor deze gebruiksrecord | 11e22ba4-87b9-4cc2 -9770-d10b894b7118 |
account_id |
tekenreeks | Id van het account waarvoor dit rapport is gegenereerd | 23e22ba4-87b9-4cc2 -9770-d10b894b7118 |
workspace_id |
tekenreeks | Id van de werkruimte die aan dit gebruik is gekoppeld | 1234567890123456 |
sku_name |
tekenreeks | Naam van de SKU | STANDARD_ALL_PURPOSE_COMPUTE |
cloud |
tekenreeks | Cloud is dit gebruik relevant voor. Mogelijke waarden zijn AWS , AZURE en GCP . |
AWS , AZURE of GCP |
usage_start_time |
timestamp | De begintijd die relevant is voor deze gebruiksrecord. Tijdzonegegevens worden vastgelegd aan het einde van de waarde met +00:00 die UTC-tijdzone vertegenwoordigen. |
2023-01-09 10:00:00.000+00:00 |
usage_end_time |
timestamp | De eindtijd die relevant is voor deze gebruiksrecord. Tijdzonegegevens worden vastgelegd aan het einde van de waarde met +00:00 die UTC-tijdzone vertegenwoordigen. |
2023-01-09 11:00:00.000+00:00 |
usage_date |
datum | Datum van de gebruiksrecord, dit veld kan worden gebruikt voor snellere aggregatie op datum | 2023-01-01 |
custom_tags |
map | Tags die zijn toegepast op dit gebruik. Bevat rekenresourcetags, taaktags, aangepaste tags voor werkruimten en budgetbeleidstags. | { “env”: “production” } |
usage_unit |
tekenreeks | Eenheid waarin dit gebruik wordt gemeten. Mogelijke waarden zijn onder andere DBU's. | DBU |
usage_quantity |
decimal | Het aantal verbruikte eenheden voor deze record. | 259.2958 |
usage_metadata |
Struct | Door het systeem verstrekte metagegevens over het gebruik, inclusief id's voor rekenresources en taken (indien van toepassing). Zie Gebruiksmetagegevensreferentie. | {cluster_id: null; instance_pool_id: null; notebook_id: null; job_id: null; node_type: null} |
identity_metadata |
Struct | Door het systeem verstrekte metagegevens over de identiteiten die betrokken zijn bij het gebruik. Zie Referentie voor identiteitsmetadata. | {"run_as": example@email.com,"created_by":null} |
record_type |
tekenreeks | Of de record oorspronkelijk, een intrekking of een aanpassing is. De waarde is ORIGINAL tenzij de record is gerelateerd aan een correctie. Zie recordtypereferentie. |
ORIGINAL |
ingestion_date |
datum | De datum waarop het record is opgenomen in de usage -tabel. |
2024-01-01 |
billing_origin_product |
tekenreeks | Het product dat afkomstig is van het gebruik. Sommige producten kunnen worden gefactureerd als verschillende SKU's. Zie voor mogelijke waarden factureringsoorsprong productreferentie. | JOBS |
product_features |
Struct | Details over de specifieke productfuncties die worden gebruikt. | Zie Productfunctiesvoor mogelijke waarden. |
usage_type |
tekenreeks | Het type gebruik dat is toegewezen aan het product of de workload voor factureringsdoeleinden. Mogelijke waarden zijn COMPUTE_TIME , STORAGE_SPACE , NETWORK_BYTES , API_OPERATION , TOKEN of GPU_TIME . |
STORAGE_SPACE |
gebruiksmetagegevens naslaginformatie
De waarden in usage_metadata
vertellen u over de objecten en resources die betrokken zijn bij de gebruiksregistratie.
Weergegeven als | Gegevenstype | Beschrijving |
---|---|---|
cluster_id |
tekenreeks | Id van het cluster dat is gekoppeld aan de gebruiksrecord |
warehouse_id |
tekenreeks | Id van het SQL-warehouse dat is gekoppeld aan de gebruiksrecord |
instance_pool_id |
tekenreeks | Id van de exemplaargroep die is gekoppeld aan de gebruiksrecord |
node_type |
tekenreeks | Het exemplaartype van de rekenresource |
job_id |
tekenreeks | Id van de taak die is gekoppeld aan de gebruiksrecord.
Retourneert alleen een waarde voor het rekengebruik van serverloze berekeningen of taken, anders wordt geretourneerd null . |
job_run_id |
tekenreeks | Id van de taakuitvoering die is gekoppeld aan de gebruiksrecord.
Retourneert alleen een waarde voor het rekengebruik van serverloze berekeningen of taken, anders wordt geretourneerd null . |
job_name |
tekenreeks | Door de gebruiker opgegeven naam van de taak die is gekoppeld aan de gebruiksrecord.
Retourneert alleen een waarde voor taken die worden uitgevoerd op serverloze berekeningen, anders wordt geretourneerd null . |
notebook_id |
tekenreeks | Id van het notitieblok dat is gekoppeld aan het gebruik.
Retourneert alleen een waarde voor serverloze berekeningen voor notebookgebruik, anders retourneert null . |
notebook_path |
tekenreeks | Werkruimteopslagpad van het notebook dat is gekoppeld aan het gebruik.
Retourneert alleen een waarde voor serverloze berekeningen voor notebookgebruik, anders retourneert null . |
dlt_pipeline_id |
tekenreeks | ID van de Delta Live Tables-pijplijn die is gekoppeld aan de gebruiksgegevens |
dlt_update_id |
tekenreeks | Id van de pijplijnupdate van Delta Live Tables die is gekoppeld aan de gebruiksrecord |
dlt_maintenance_id |
tekenreeks | Id van de pijplijnonderhoudstaken van Delta Live Tables die zijn gekoppeld aan de gebruiksrecord |
run_name |
tekenreeks | Unieke gebruikers-id van het Foundation Model Fine-tuning dat is gekoppeld aan de gebruiksrecord |
endpoint_name |
tekenreeks | De naam van het model dat het eindpunt of het eindpunt voor vectorzoekopdrachten dat is gekoppeld aan de gebruiksrecord |
endpoint_id |
tekenreeks | Id van het model dat eindpunt of vectorzoekeindpunt bedient dat is gekoppeld aan de gebruiksrecord |
central_clean_room_id |
tekenreeks | Id van de centrale clean room die is gekoppeld aan de gebruiksrecord |
metastore_id |
tekenreeks | Id van de metastore die is gekoppeld aan de gebruiksrecord. |
app_id |
tekenreeks | Id van de app die is gekoppeld aan de gebruiksrecord. |
app_name |
tekenreeks | Door de gebruiker opgegeven naam van de app die is gekoppeld aan de gebruiksrecord. |
naslaginformatie voor metagegevens van identiteit
Met de kolom identity_metadata
kunt u bepalen wie verantwoordelijk is voor een serverloze factureringsrecord. De kolom bevat een run_as
waarde die het gebruik aan een identiteit toegeeft.
Daarnaast logt het gebruik dat is toegeschreven aan Databricks Apps een waarde in het veld identity_metadata.created_by
. Deze waarde wordt gevuld met het e-mailadres van de gebruiker die de app heeft gemaakt.
De identiteit die is vastgelegd, identity_metadata.run_as
is afhankelijk van het product dat aan het gebruik is gekoppeld. Raadpleeg de volgende tabel voor het identity_metadata.run_as
gedrag:
Workloadtype | Identiteit van run_as |
---|---|
Taken berekenen | De gebruiker of service-principal die in de run_as instelling is gedefinieerd. Taken worden standaard uitgevoerd als de identiteit van de eigenaar van de taak, maar beheerders kunnen dit wijzigen in een andere gebruiker of service-principal. |
Serverloze rekenkracht voor taken | De gebruiker of service-principal die in de run_as instelling is gedefinieerd. Taken worden standaard uitgevoerd als de identiteit van de eigenaar van de taak, maar beheerders kunnen dit wijzigen in een andere gebruiker of service-principal. |
Serverloze rekenkracht voor notebooks | De gebruiker die de notebookopdrachten heeft uitgevoerd (met name de gebruiker die de notebooksessie heeft gemaakt). Voor gedeelde notitieblokken omvat dit gebruik door andere gebruikers die dezelfde notebooksessie delen. |
Delta Live Tables-pijplijnen | De gebruiker wiens machtigingen worden gebruikt om de Delta Live Tables-pijplijn uit te voeren. Dit kan worden gewijzigd door het eigendom van de pijplijn over te dragen. |
Foundation Model Fine-tuning | De gebruiker of service-principal die de trainingsuitvoering heeft geïnitieerd. |
Voorspellende optimalisatie | De Databricks-bezittende service-principal die voorspellende optimalisatiebewerkingen uitvoert. |
Lakehouse-bewaking | De gebruiker die de monitor heeft gemaakt. |
verwijzing naar recordtype
De billing.usage
tabel ondersteunt correcties. Correcties treden op wanneer een veld van de gebruiksrecord onjuist is en moet worden opgelost.
Wanneer er een correctie plaatsvindt, voegt Azure Databricks twee nieuwe records toe aan de tabel. Een intrekkingsrecord onderhandelt de oorspronkelijke onjuiste record en vervolgens bevat een aanpassingsrecord de gecorrigeerde informatie. Correctierecords worden geïdentificeerd met behulp van het record_type
veld:
-
RETRACTION
: Wordt gebruikt om het oorspronkelijke onjuiste gebruik te vernieten. Alle velden zijn identiek aan deORIGINAL
record, behalveusage_quantity
een negatieve waarde die de oorspronkelijke gebruikshoeveelheid annuleert. Als de gebruikshoeveelheid van de oorspronkelijke record bijvoorbeeld was259.4356
, zou de intrekkingsrecord een gebruikshoeveelheid van-259.4356
hebben. -
RESTATEMENT
: De record met de juiste velden en gebruikshoeveelheid.
De volgende query retourneert bijvoorbeeld de juiste hoeveelheid per uur met betrekking tot een job_id
, zelfs als er correcties zijn aangebracht. Door de gebruikshoeveelheid te aggregeren, wordt het oorspronkelijke record door de correctieregistratie ongedaan gemaakt en worden alleen de waarden van de herformulering geretourneerd.
SELECT
usage_metadata.job_id, usage_start_time, usage_end_time,
SUM(usage_quantity) as usage_quantity
FROM system.billing.usage
GROUP BY ALL
HAVING usage_quantity != 0
Notitie
Voor correcties waarbij de oorspronkelijke gebruiksrecord niet mag zijn geschreven, kan een correctie alleen een intrekkingsrecord en geen aanpassingsrecord toevoegen.
productreferentie voor factureringsoorsprong
Sommige Databricks-producten worden gefactureerd onder dezelfde gedeelde SKU. Om u te helpen onderscheid te maken tussen het gebruik, bieden de kolommen billing_origin_product
en product_features
meer inzicht in het specifieke product en de specifieke functies die aan het gebruik zijn gekoppeld.
In de kolom billing_origin_product
ziet u het Databricks-product dat is gekoppeld aan de gebruiksrecord. De waarden zijn onder andere:
JOBS
DLT
SQL
ALL_PURPOSE
MODEL_SERVING
INTERACTIVE
DEFAULT_STORAGE
VECTOR_SEARCH
LAKEHOUSE_MONITORING
PREDICTIVE_OPTIMIZATION
ONLINE_TABLES
FOUNDATION_MODEL_TRAINING
AGENT_EVALUATION
FINE_GRAIN_ACCESS_CONTROL
APPS
: kosten voor het bouwen en uitvoeren van Databricks-apps
Productkenmerkenoverzicht
De kolom product_features
is een object met informatie over de specifieke productfuncties die worden gebruikt en bevat de volgende sleutel-/waardeparen:
-
jobs_tier
: waarden zijn onder andereLIGHT
,CLASSIC
ofnull
-
sql_tier
: waarden zijn onder andereCLASSIC
,PRO
ofnull
-
dlt_tier
: waarden zijn onder andereCORE
,PRO
,ADVANCED
ofnull
-
is_serverless
: waarden zijntrue
offalse
ofnull
-
is_photon
: waarden zijntrue
offalse
ofnull
-
serving_type
: waarden zijn onder andereMODEL
,GPU_MODEL
,FOUNDATION_MODEL
,FEATURE
ofnull