Tabellreferens för fakturerbart användningssystem
Den här artikeln innehåller en översikt över tabellen med fakturerbara användningssystem, inklusive schema- och exempelfrågor. Med systemtabeller centraliseras och dirigeras ditt kontos fakturerbara användningsdata till alla regioner, så att du kan visa kontots globala användning från vilken region din arbetsyta befinner sig i.
Information om hur du använder den här tabellen för att övervaka kostnader och exempelfrågor finns i Övervaka kostnader med hjälp av systemtabeller.
Tabellsökväg: Den här systemtabellen finns på system.billing.usage
.
Schema för tabell över fakturerbar användning
Tabellen med fakturerbar användning använder följande schema:
Kolumnnamn | Datatyp | beskrivning | Exempel |
---|---|---|---|
record_id |
sträng | Unikt ID för den här användningsposten | 11e22ba4-87b9-4cc2-9770-d10b894b7118 |
account_id |
sträng | ID för kontot som den här rapporten genererades för | 23e22ba4-87b9-4cc2-9770-d10b894b7118 |
workspace_id |
sträng | ID för arbetsytan som den här användningen var associerad med | 1234567890123456 |
sku_name |
sträng | SKU:ns namn | STANDARD_ALL_PURPOSE_COMPUTE |
cloud |
sträng | Moln som är associerat med den här användningen. Möjliga värden är AWS , AZURE och GCP . |
AWS , AZURE eller GCP |
usage_start_time |
tidsstämpel | Starttiden som är relevant för den här användningsposten. Tidszonsinformation registreras i slutet av värdet med +00:00 som representerar UTC-tidszon. |
2023-01-09 10:00:00.000+00:00 |
usage_end_time |
tidsstämpel | Den sluttid som är relevant för den här användningsposten. Tidszonsinformation registreras i slutet av värdet med +00:00 som representerar UTC-tidszon. |
2023-01-09 11:00:00.000+00:00 |
usage_date |
datum | Datum för användningsposten, det här fältet kan användas för snabbare aggregering efter datum | 2023-01-01 |
custom_tags |
karta | Anpassade taggar som är associerade med användningsposten | { “env”: “production” } |
usage_unit |
sträng | Enhet som den här användningen mäts i | DBU |
usage_quantity |
decimal | Antal enheter som förbrukades för den här posten | 259.2958 |
usage_metadata |
Struct | Metadata som tillhandahålls av systemet om användningen, inklusive ID:t för beräkningsresurser och jobb (om tillämpligt). Se användningsmetadata. | {cluster_id: null; instance_pool_id: null; notebook_id: null; job_id: null; node_type: null} |
identity_metadata |
Struct | Metadata som tillhandahålls av systemet om de identiteter som ingår i användningen. Se Identity Metadata. | Se Identitetsmetadata |
record_type |
sträng | Oavsett om registreringen är original, en indragning eller en omskrivning. Värdet är ORIGINAL såvida inte posten är relaterad till en korrigering. Se även posttyp. |
ORIGINAL |
ingestion_date |
datum | Datum då datasetet matades in i tabellen usage |
2024-01-01 |
billing_origin_product |
sträng | Den produkt som har sitt ursprung i användningen. Vissa produkter kan faktureras som olika SKU:er. Möjliga värden finns i Product. | JOBS |
product_features |
Struct | Information om de specifika produktfunktioner som används. Se Produktens funktioner. | Se produktens egenskaper |
usage_type |
sträng | Den typ av användning som tillskrivs produkten eller arbetsbelastningen i faktureringssyfte. Möjliga värden är COMPUTE_TIME , STORAGE_SPACE , NETWORK_BYTES , NETWORK_HOUR , API_OPERATION , TOKEN eller GPU_TIME . |
STORAGE_SPACE |
Referens för användningsmetadata
Värdena i usage_metadata
berättar om de objekt och resurser som ingår i användningsregistret.
Värde | Datatyp | beskrivning |
---|---|---|
cluster_id |
sträng | ID för klustret som är associerat med användningsposten |
warehouse_id |
sträng | ID för det SQL-datalager som är associerat med användningsposten |
instance_pool_id |
sträng | ID för instanspoolen som är associerad med användningsposten |
node_type |
sträng | Instanstypen för beräkningsresursen |
job_id |
sträng | ID för jobbet som är associerat med användningsposten.
Returnerar endast ett värde för serverlös beräknings- eller jobbberäkningsanvändning, annars returneras null . |
job_run_id |
sträng | ID för jobbkörningen som är associerad med användningsregister.
Returnerar endast ett värde för serverlös beräknings- eller jobbberäkningsanvändning, annars returneras null . |
job_name |
sträng | Användarnamn för det jobb som är associerat med användningsposten.
Returnerar endast ett värde för jobb som körs på serverlös beräkning, annars returneras null . |
notebook_id |
sträng | ID för anteckningsboken som är associerad med användningen.
Returnerar endast ett värde för serverlös beräkning för notebook-användning, annars returneras null . |
notebook_path |
sträng | Lagringssökvägen för arbetsytan för notebook-filen som är associerad med användningen.
Returnerar endast ett värde för serverlös beräkning för notebook-användning, annars returneras null . |
dlt_pipeline_id |
sträng | ID för DLT-pipelinen som är associerad med användningsposten |
dlt_update_id |
sträng | ID för DLT-pipelineuppdateringen som är associerad med användningsrekordet |
dlt_maintenance_id |
sträng | ID för DLT-pipelinens underhållsaktiviteter som är associerade med användningsposten |
run_name |
sträng | Unik användarorienterad identifierare för finjusteringen av grundmodellen som är associerad med användningsposten. |
endpoint_name |
sträng | Namnet på den modell som betjänar slutpunkten eller vektorsökningsslutpunkten som är associerad med användningsposten |
endpoint_id |
sträng | ID för den modell som betjänar slutpunkten eller vektorsökningsslutpunkten som är associerad med användningsposten |
central_clean_room_id |
sträng | ID för det centrala rena rummet som är associerat med användningsposten |
source_region |
sträng | Region för arbetsytan som är associerad med användningen. Returnerar endast ett värde för nätverksrelaterade kostnader. |
destination_region |
sträng | Region för resursen som används. Returnerar endast ett värde för nätverksrelaterade kostnader. |
metastore_id |
sträng | ID för metaarkivet som är associerat med användningsposten |
app_id |
sträng | ID för appen som är associerad med användningsposten |
app_name |
sträng | Användarnamn för appen som är associerad med användningsposten |
private_endpoint_name |
sträng | Namnet på den tillämpliga privata slutpunkten. Returnerar endast ett värde för nätverksrelaterade kostnader. |
metadatareferens för identitet
Kolumnen identity_metadata
innehåller mer information om de identiteter som ingår i användningen. Fält run_as
loggar vem som kör arbetslasten. Fältet owned_by
gäller endast användning av SQL-lager och loggar användaren eller tjänstens huvudkonto som äger det SQL-lager som ansvarar för användningen.
Dessutom loggar användning som tillskrivs Databricks Apps ett värde i fältet identity_metadata.created_by
. Det här värdet fylls i med e-postmeddelandet för användaren som skapade appen.
run_as identiteter
Identiteten som registreras i identity_metadata.run_as
beror på vilken produkt som är associerad med användningen. Referera till följande tabell för identity_metadata.run_as
beteende:
Typ av arbetsbelastning | Identitet för run_as |
---|---|
Jobbberäkning | Användaren eller tjänstens huvudnamn som definierats i inställningen run_as . Som standard körs jobb som identitet för jobbägaren, men administratörer kan ändra detta till en annan användare eller tjänstens huvudnamn. |
Serverlös beräkning för jobb | Användaren eller tjänstens huvudnamn som definierats i inställningen run_as . Som standard körs jobb som identitet för jobbägaren, men administratörer kan ändra detta till en annan användare eller tjänstens huvudnamn. |
Serverlös beräkning för notebook-filer | Användaren som körde notebook-kommandona (specifikt användaren som skapade notebook-sessionen). För delade anteckningsböcker inkluderar detta användning av andra användare som delar samma anteckningsbokssession. |
DLT-pipelines | Den användare vars behörigheter används för att köra DLT-pipelinen. Detta kan ändras genom att överföra pipelinens ägarskap. |
Finjustering av grundmodell | Användaren eller tjänsthuvudmannen som initierade körningen för finjusteringsträning. |
Förutsägande optimering | Den Databricks-ägda tjänstens huvudansvarig som utför förutsägande optimeringsoperationer. |
Lakehouse-övervakning | Användaren som skapade bildskärmen. |
referens för posttyp
Tabellen billing.usage
stöder korrigeringar. Korrigeringar sker när något fält i användningsposten är felaktigt och måste åtgärdas.
När en korrigering sker lägger Azure Databricks till två nya poster i tabellen. En indragspost negerar den ursprungliga felaktiga posten och sedan innehåller en omskrivningspost den korrigerade informationen. Korrigeringsposter identifieras med hjälp av fältet record_type
:
-
RETRACTION
: Används för att negera den ursprungliga felaktiga användningen. Alla fält är identiska medORIGINAL
posten förutomusage_quantity
, vilket är ett negativt värde som tar bort den ursprungliga användningskvantiteten. Om den ursprungliga postens användningskvantitet till exempel var259.4356
skulle indragsposten ha en användningskvantitet på-259.4356
. -
RESTATEMENT
: Posten som innehåller rätt fält och användningskvantitet.
Följande fråga returnerar till exempel rätt användningskvantitet varje timme som är relaterad till en job_id
, även om korrigeringar har gjorts. Genom att aggregera användningskvantiteten negerar återdragningsposten den ursprungliga posten och endast omräkningsvärdena returneras.
SELECT
usage_metadata.job_id, usage_start_time, usage_end_time,
SUM(usage_quantity) as usage_quantity
FROM system.billing.usage
GROUP BY ALL
HAVING usage_quantity != 0
Kommentar
För korrigeringar där den ursprungliga användningsposten inte borde ha skrivits kan en korrigering endast lägga till en återkallningspost och ingen omskrivningspost.
referens för produktens faktureringsursprung
Vissa Databricks-produkter faktureras under samma delade SKU. För att hjälpa dig att särskilja användningen ger kolumnerna billing_origin_product
och product_features
mer insikt i den specifika produkt och de funktioner som är associerade med användningen.
Kolumnen billing_origin_product
visar den Databricks-produkt som är associerad med användningsposten. Värdena omfattar:
JOBS
DLT
SQL
ALL_PURPOSE
MODEL_SERVING
INTERACTIVE
DEFAULT_STORAGE
VECTOR_SEARCH
LAKEHOUSE_MONITORING
PREDICTIVE_OPTIMIZATION
ONLINE_TABLES
FOUNDATION_MODEL_TRAINING
AGENT_EVALUATION
FINE_GRAIN_ACCESS_CONTROL
-
NETWORKING
: Kostnader som är associerade med att ansluta serverlös beräkning till dina resurser via privata slutpunkter. FörNETWORKING
användning ärworkspace_id
null
,usage_unit
ärhour
ochnetworking.connectivity_type
ärPRIVATE_IP
. -
APPS
: Kostnader som är kopplade till att skapa och köra Databricks Apps
referens för -produktfunktioner
Kolumnen product_features
är ett objekt som innehåller information om de specifika produktfunktioner som används och innehåller följande nyckel/värde-par:
-
jobs_tier
: värden inkluderarLIGHT
,CLASSIC
ellernull
-
sql_tier
: värden inkluderarCLASSIC
,PRO
ellernull
-
dlt_tier
: värden inkluderarCORE
,PRO
,ADVANCED
ellernull
-
is_serverless
: värden inkluderartrue
ellerfalse
ellernull
-
is_photon
: värden inkluderartrue
ellerfalse
ellernull
-
serving_type
: värden inkluderarMODEL
,GPU_MODEL
,FOUNDATION_MODEL
,FEATURE
ellernull
-
networking.connectivity_type
: värdena omfattarPUBLIC_IP
ochPRIVATE_IP