Tabellreferens för fakturerbart användningssystem

Artikel
03/05/2025

Den här artikeln innehåller en översikt över tabellen med fakturerbara användningssystem, inklusive schema- och exempelfrågor. Med systemtabeller centraliseras och dirigeras ditt kontos fakturerbara användningsdata till alla regioner, så att du kan visa kontots globala användning från vilken region din arbetsyta befinner sig i.

Information om hur du använder den här tabellen för att övervaka kostnader och exempelfrågor finns i Övervaka kostnader med hjälp av systemtabeller.

Tabellsökväg: Den här systemtabellen finns på system.billing.usage.

Schema för tabell över fakturerbar användning

Tabellen med fakturerbar användning använder följande schema:

Kolumnnamn	Datatyp	beskrivning	Exempel
`record_id`	sträng	Unikt ID för den här användningsposten	`11e22ba4-87b9-4cc2-9770-d10b894b7118`
`account_id`	sträng	ID för kontot som den här rapporten genererades för	`23e22ba4-87b9-4cc2-9770-d10b894b7118`
`workspace_id`	sträng	ID för arbetsytan som den här användningen var associerad med	`1234567890123456`
`sku_name`	sträng	SKU:ns namn	`STANDARD_ALL_PURPOSE_COMPUTE`
`cloud`	sträng	Moln som är associerat med den här användningen. Möjliga värden är `AWS`, `AZURE`och `GCP`.	`AWS`, `AZURE` eller `GCP`
`usage_start_time`	tidsstämpel	Starttiden som är relevant för den här användningsposten. Tidszonsinformation registreras i slutet av värdet med `+00:00` som representerar UTC-tidszon.	`2023-01-09 10:00:00.000+00:00`
`usage_end_time`	tidsstämpel	Den sluttid som är relevant för den här användningsposten. Tidszonsinformation registreras i slutet av värdet med `+00:00` som representerar UTC-tidszon.	`2023-01-09 11:00:00.000+00:00`
`usage_date`	datum	Datum för användningsposten, det här fältet kan användas för snabbare aggregering efter datum	`2023-01-01`
`custom_tags`	karta	Anpassade taggar som är associerade med användningsposten	`{ “env”: “production” }`
`usage_unit`	sträng	Enhet som den här användningen mäts i	`DBU`
`usage_quantity`	decimal	Antal enheter som förbrukades för den här posten	`259.2958`
`usage_metadata`	Struct	Metadata som tillhandahålls av systemet om användningen, inklusive ID:t för beräkningsresurser och jobb (om tillämpligt). Se användningsmetadata.	`{cluster_id: null; instance_pool_id: null; notebook_id: null; job_id: null; node_type: null}`
`identity_metadata`	Struct	Metadata som tillhandahålls av systemet om de identiteter som ingår i användningen. Se Identity Metadata.	Se Identitetsmetadata
`record_type`	sträng	Oavsett om registreringen är original, en indragning eller en omskrivning. Värdet är `ORIGINAL` såvida inte posten är relaterad till en korrigering. Se även posttyp.	`ORIGINAL`
`ingestion_date`	datum	Datum då datasetet matades in i tabellen `usage`	`2024-01-01`
`billing_origin_product`	sträng	Den produkt som har sitt ursprung i användningen. Vissa produkter kan faktureras som olika SKU:er. Möjliga värden finns i Product.	`JOBS`
`product_features`	Struct	Information om de specifika produktfunktioner som används. Se Produktens funktioner.	Se produktens egenskaper
`usage_type`	sträng	Den typ av användning som tillskrivs produkten eller arbetsbelastningen i faktureringssyfte. Möjliga värden är `COMPUTE_TIME`, `STORAGE_SPACE`, `NETWORK_BYTES`, `NETWORK_HOUR`, `API_OPERATION`, `TOKEN`eller `GPU_TIME`.	`STORAGE_SPACE`

Referens för användningsmetadata

Värdena i usage_metadata berättar om de objekt och resurser som ingår i användningsregistret.

Värde	Datatyp	beskrivning
`cluster_id`	sträng	ID för klustret som är associerat med användningsposten
`warehouse_id`	sträng	ID för det SQL-datalager som är associerat med användningsposten
`instance_pool_id`	sträng	ID för instanspoolen som är associerad med användningsposten
`node_type`	sträng	Instanstypen för beräkningsresursen
`job_id`	sträng	ID för jobbet som är associerat med användningsposten. Returnerar endast ett värde för serverlös beräknings- eller jobbberäkningsanvändning, annars returneras `null`.
`job_run_id`	sträng	ID för jobbkörningen som är associerad med användningsregister. Returnerar endast ett värde för serverlös beräknings- eller jobbberäkningsanvändning, annars returneras `null`.
`job_name`	sträng	Användarnamn för det jobb som är associerat med användningsposten. Returnerar endast ett värde för jobb som körs på serverlös beräkning, annars returneras `null`.
`notebook_id`	sträng	ID för anteckningsboken som är associerad med användningen. Returnerar endast ett värde för serverlös beräkning för notebook-användning, annars returneras `null`.
`notebook_path`	sträng	Lagringssökvägen för arbetsytan för notebook-filen som är associerad med användningen. Returnerar endast ett värde för serverlös beräkning för notebook-användning, annars returneras `null`.
`dlt_pipeline_id`	sträng	ID för DLT-pipelinen som är associerad med användningsposten
`dlt_update_id`	sträng	ID för DLT-pipelineuppdateringen som är associerad med användningsrekordet
`dlt_maintenance_id`	sträng	ID för DLT-pipelinens underhållsaktiviteter som är associerade med användningsposten
`run_name`	sträng	Unik användarorienterad identifierare för finjusteringen av grundmodellen som är associerad med användningsposten.
`endpoint_name`	sträng	Namnet på den modell som betjänar slutpunkten eller vektorsökningsslutpunkten som är associerad med användningsposten
`endpoint_id`	sträng	ID för den modell som betjänar slutpunkten eller vektorsökningsslutpunkten som är associerad med användningsposten
`central_clean_room_id`	sträng	ID för det centrala rena rummet som är associerat med användningsposten
`source_region`	sträng	Region för arbetsytan som är associerad med användningen. Returnerar endast ett värde för nätverksrelaterade kostnader.
`destination_region`	sträng	Region för resursen som används. Returnerar endast ett värde för nätverksrelaterade kostnader.
`metastore_id`	sträng	ID för metaarkivet som är associerat med användningsposten
`app_id`	sträng	ID för appen som är associerad med användningsposten
`app_name`	sträng	Användarnamn för appen som är associerad med användningsposten
`private_endpoint_name`	sträng	Namnet på den tillämpliga privata slutpunkten. Returnerar endast ett värde för nätverksrelaterade kostnader.

metadatareferens för identitet

Kolumnen identity_metadata innehåller mer information om de identiteter som ingår i användningen. Fält run_as loggar vem som kör arbetslasten. Fältet owned_by gäller endast användning av SQL-lager och loggar användaren eller tjänstens huvudkonto som äger det SQL-lager som ansvarar för användningen.

Dessutom loggar användning som tillskrivs Databricks Apps ett värde i fältet identity_metadata.created_by. Det här värdet fylls i med e-postmeddelandet för användaren som skapade appen.

run_as identiteter

Identiteten som registreras i identity_metadata.run_as beror på vilken produkt som är associerad med användningen. Referera till följande tabell för identity_metadata.run_as beteende:

Typ av arbetsbelastning	Identitet för `run_as`
Jobbberäkning	Användaren eller tjänstens huvudnamn som definierats i inställningen `run_as` . Som standard körs jobb som identitet för jobbägaren, men administratörer kan ändra detta till en annan användare eller tjänstens huvudnamn.
Serverlös beräkning för jobb	Användaren eller tjänstens huvudnamn som definierats i inställningen `run_as` . Som standard körs jobb som identitet för jobbägaren, men administratörer kan ändra detta till en annan användare eller tjänstens huvudnamn.
Serverlös beräkning för notebook-filer	Användaren som körde notebook-kommandona (specifikt användaren som skapade notebook-sessionen). För delade anteckningsböcker inkluderar detta användning av andra användare som delar samma anteckningsbokssession.
DLT-pipelines	Den användare vars behörigheter används för att köra DLT-pipelinen. Detta kan ändras genom att överföra pipelinens ägarskap.
Finjustering av grundmodell	Användaren eller tjänsthuvudmannen som initierade körningen för finjusteringsträning.
Förutsägande optimering	Den Databricks-ägda tjänstens huvudansvarig som utför förutsägande optimeringsoperationer.
Lakehouse-övervakning	Användaren som skapade bildskärmen.

referens för posttyp

Tabellen billing.usage stöder korrigeringar. Korrigeringar sker när något fält i användningsposten är felaktigt och måste åtgärdas.

När en korrigering sker lägger Azure Databricks till två nya poster i tabellen. En indragspost negerar den ursprungliga felaktiga posten och sedan innehåller en omskrivningspost den korrigerade informationen. Korrigeringsposter identifieras med hjälp av fältet record_type :

RETRACTION: Används för att negera den ursprungliga felaktiga användningen. Alla fält är identiska med ORIGINAL posten förutom usage_quantity, vilket är ett negativt värde som tar bort den ursprungliga användningskvantiteten. Om den ursprungliga postens användningskvantitet till exempel var 259.4356skulle indragsposten ha en användningskvantitet på -259.4356.
RESTATEMENT: Posten som innehåller rätt fält och användningskvantitet.

Följande fråga returnerar till exempel rätt användningskvantitet varje timme som är relaterad till en job_id, även om korrigeringar har gjorts. Genom att aggregera användningskvantiteten negerar återdragningsposten den ursprungliga posten och endast omräkningsvärdena returneras.

SELECT
  usage_metadata.job_id, usage_start_time, usage_end_time,
  SUM(usage_quantity) as usage_quantity
FROM system.billing.usage
GROUP BY ALL
HAVING usage_quantity != 0

Kommentar

För korrigeringar där den ursprungliga användningsposten inte borde ha skrivits kan en korrigering endast lägga till en återkallningspost och ingen omskrivningspost.

referens för produktens faktureringsursprung

Vissa Databricks-produkter faktureras under samma delade SKU. För att hjälpa dig att särskilja användningen ger kolumnerna billing_origin_product och product_features mer insikt i den specifika produkt och de funktioner som är associerade med användningen.

Kolumnen billing_origin_product visar den Databricks-produkt som är associerad med användningsposten. Värdena omfattar:

JOBS
DLT
SQL
ALL_PURPOSE
MODEL_SERVING
INTERACTIVE
DEFAULT_STORAGE
VECTOR_SEARCH
LAKEHOUSE_MONITORING
PREDICTIVE_OPTIMIZATION
ONLINE_TABLES
FOUNDATION_MODEL_TRAINING
AGENT_EVALUATION
FINE_GRAIN_ACCESS_CONTROL

NETWORKING: Kostnader som är associerade med att ansluta serverlös beräkning till dina resurser via privata slutpunkter. För NETWORKING användning är workspace_idnull, usage_unit är houroch networking.connectivity_type är PRIVATE_IP.
APPS: Kostnader som är kopplade till att skapa och köra Databricks Apps

referens för -produktfunktioner

Kolumnen product_features är ett objekt som innehåller information om de specifika produktfunktioner som används och innehåller följande nyckel/värde-par:

jobs_tier: värden inkluderar LIGHT, CLASSICeller null
sql_tier: värden inkluderar CLASSIC, PROeller null
dlt_tier: värden inkluderar CORE, PRO, ADVANCEDeller null
is_serverless: värden inkluderar true eller falseeller null
is_photon: värden inkluderar true eller falseeller null
serving_type: värden inkluderar MODEL, GPU_MODEL, FOUNDATION_MODEL, FEATUREeller null

networking.connectivity_type: värdena omfattar PUBLIC_IP och PRIVATE_IP

Dela via