Tabellreferens för fakturerbart användningssystem
Den här artikeln innehåller en översikt över tabellen med fakturerbara användningssystem, inklusive schema- och exempelfrågor. Med systemtabeller centraliseras och dirigeras ditt kontos fakturerbara användningsdata till alla regioner, så att du kan visa kontots globala användning från vilken region din arbetsyta befinner sig i.
Information om hur du använder den här tabellen för att övervaka kostnader och exempelfrågor finns i Övervaka kostnader med hjälp av systemtabeller.
Tabellsökväg: Den här systemtabellen finns på system.billing.usage
.
Schema för fakturerbar användningstabell
Tabellen med fakturerbar användning använder följande schema:
Kolumnnamn | Datatyp | beskrivning | Exempel |
---|---|---|---|
record_id |
sträng | Unikt ID för den här användningsposten | 11e22ba4-87b9-4cc2 -9770-d10b894b7118 |
account_id |
sträng | ID för kontot som den här rapporten genererades för | 23e22ba4-87b9-4cc2 -9770-d10b894b7118 |
workspace_id |
sträng | ID för arbetsytan som den här användningen var associerad med | 1234567890123456 |
sku_name |
sträng | SKU:ns namn | STANDARD_ALL_PURPOSE_COMPUTE |
cloud |
sträng | Moln som den här användningen är relevant för. Möjliga värden är AWS , AZURE och GCP . |
AWS , AZURE eller GCP |
usage_start_time |
timestamp | Starttiden som är relevant för den här användningsposten. Tidszonsinformation registreras i slutet av värdet med +00:00 som representerar UTC-tidszon. |
2023-01-09 10:00:00.000+00:00 |
usage_end_time |
timestamp | Den sluttid som är relevant för den här användningsposten. Tidszonsinformation registreras i slutet av värdet med +00:00 som representerar UTC-tidszon. |
2023-01-09 11:00:00.000+00:00 |
usage_date |
datum | Datum för användningsposten, det här fältet kan användas för snabbare aggregering efter datum | 2023-01-01 |
custom_tags |
map | Taggar som används för den här användningen. Innehåller taggar för beräkningsresurser, jobbtaggar, anpassade arbetsytetaggar och budgetprinciptaggar. | { “env”: “production” } |
usage_unit |
sträng | Enhet som den här användningen mäts i. Möjliga värden inkluderar DBU:er. | DBU |
usage_quantity |
decimal | Antal enheter som förbrukas för den här posten. | 259.2958 |
usage_metadata |
Struct | Metadata som tillhandahålls av systemet om användningen, inklusive ID:t för beräkningsresurser och jobb (om tillämpligt). Se användningsmetadata referens. | {cluster_id: null; instance_pool_id: null; notebook_id: null; job_id: null; node_type: null} |
identity_metadata |
Struct | Metadata som tillhandahålls av systemet om de identiteter som ingår i användningen. Se identitetsmetadatareferensen för . | {"run_as": example@email.com,"created_by":null} |
record_type |
sträng | Oavsett om posten är original, en indragning eller en omskrivning. Värdet är ORIGINAL såvida inte posten är relaterad till en korrigering. Se posttypsreferensen . |
ORIGINAL |
ingestion_date |
datum | Datum då registret registrerades i tabellen usage . |
2024-01-01 |
billing_origin_product |
sträng | Den produkt som har sitt ursprung i användningen. Vissa produkter kan faktureras som olika SKU:er. Möjliga värden finns i produktreferens för faktureringsursprung. | JOBS |
product_features |
Struct | Information om de specifika produktfunktioner som används. | Möjliga värden finns i Produktfunktioner. |
usage_type |
sträng | Den typ av användning som tillskrivs produkten eller arbetsbelastningen i faktureringssyfte. Möjliga värden är COMPUTE_TIME , STORAGE_SPACE , NETWORK_BYTES , API_OPERATION , TOKEN eller GPU_TIME . |
STORAGE_SPACE |
Referens för användningsmetadata av
Värdena i usage_metadata
berättar om de objekt och resurser som ingår i användningsregistret.
Värde | Datatyp | beskrivning |
---|---|---|
cluster_id |
sträng | ID för klustret som är associerat med användningsposten |
warehouse_id |
sträng | ID för DET SQL-lager som är associerat med användningsposten |
instance_pool_id |
sträng | ID för instanspoolen som är associerad med användningsposten |
node_type |
sträng | Instanstypen för beräkningsresursen |
job_id |
sträng | ID för jobbet som är associerat med användningsposten.
Returnerar endast ett värde för serverlös beräknings- eller jobbberäkningsanvändning, annars returneras null . |
job_run_id |
sträng | ID för jobbkörningen som är associerad med användningsposten.
Returnerar endast ett värde för serverlös beräknings- eller jobbberäkningsanvändning, annars returneras null . |
job_name |
sträng | Användarnamn för det jobb som är associerat med användningsposten.
Returnerar endast ett värde för jobb som körs på serverlös beräkning, annars returneras null . |
notebook_id |
sträng | ID för notebook-filen som är associerad med användningen.
Returnerar endast ett värde för serverlös beräkning för notebook-användning, annars returneras null . |
notebook_path |
sträng | Lagringssökvägen för arbetsytan för notebook-filen som är associerad med användningen.
Returnerar endast ett värde för serverlös beräkning för notebook-användning, annars returneras null . |
dlt_pipeline_id |
sträng | ID för Delta Live Tables-pipelinen som är associerad med användningsposten |
dlt_update_id |
sträng | ID för pipelineuppdateringen för Delta Live Tables som är associerad med användningsposten |
dlt_maintenance_id |
sträng | ID för Delta Live Tables-pipelineunderhållsuppgifter som är associerade med användningsposten |
run_name |
sträng | Identifierare riktad till användare för finjustering av grundmodellen som är associerad med användningshistoriken |
endpoint_name |
sträng | Namnet på den modell som betjänar slutpunkten eller vektorsökningsslutpunkten som är associerad med användningsposten |
endpoint_id |
sträng | ID för den modell som betjänar slutpunkten eller vektorsökningsslutpunkten som är associerad med användningsposten |
central_clean_room_id |
sträng | ID för det centrala rena rummet som är associerat med användningsposten |
metastore_id |
sträng | ID för det metaarkiv som är associerat med användningsposten. |
app_id |
sträng | ID för appen som är associerad med användningsposten. |
app_name |
sträng | Användarnamn för den app som är associerad med användningsposten. |
metadatareferens för identitet
Kolumnen identity_metadata
kan hjälpa dig att identifiera vem som ansvarar för en serverlös fakturatransaktion. Kolumnen innehåller ett run_as
värde som tillskriver användningen till en identitet.
Dessutom loggar användning som tillskrivs Databricks Apps ett värde i fältet identity_metadata.created_by
. Det här värdet fylls i med e-postmeddelandet för användaren som skapade appen.
Identiteten som registreras i identity_metadata.run_as
beror på vilken produkt som är associerad med användningen. Referera till följande tabell för identity_metadata.run_as
beteende:
Typ av arbetsbelastning | Identitet för run_as |
---|---|
Jobbberäkning | Användaren eller tjänstens huvudnamn som definierats i inställningen run_as . Som standard körs jobb som identitet för jobbägaren, men administratörer kan ändra detta till en annan användare eller tjänstens huvudnamn. |
Serverlös beräkning för jobb | Användaren eller tjänstens huvudnamn som definierats i inställningen run_as . Som standard körs jobb som identitet för jobbägaren, men administratörer kan ändra detta till en annan användare eller tjänstens huvudnamn. |
Serverlös beräkning för notebook-filer | Användaren som körde notebook-kommandona (specifikt användaren som skapade notebook-sessionen). För delade notebook-filer inkluderar detta användning av andra användare som delar samma notebook-session. |
Delta Live Tables-pipelines | Den användare vars behörigheter används för att köra Delta Live Tables-pipelinen. Detta kan ändras genom att överföra pipelinens ägarskap. |
Finjustering av grundmodell | Användaren eller tjänstens huvudnamn som initierade finjusteringsträningskörningen. |
Förutsägande optimering | Det Databricks-ägda tjänstprincipalen som utför förutsägande optimeringsoperationer. |
Lakehouse-övervakning | Användaren som skapade övervakaren. |
referens för posttyp
Tabellen billing.usage
stöder korrigeringar. Korrigeringar sker när något fält i användningsposten är felaktigt och måste åtgärdas.
När en korrigering sker lägger Azure Databricks till två nya poster i tabellen. En indragspost negerar den ursprungliga felaktiga posten och sedan innehåller en omskrivningspost den korrigerade informationen. Korrigeringsposter identifieras med hjälp av fältet record_type
:
-
RETRACTION
: Används för att negera den ursprungliga felaktiga användningen. Alla fält är identiska medORIGINAL
posten förutomusage_quantity
, vilket är ett negativt värde som tar bort den ursprungliga användningskvantiteten. Om den ursprungliga postens användningskvantitet till exempel var259.4356
skulle indragsposten ha en användningskvantitet på-259.4356
. -
RESTATEMENT
: Posten som innehåller rätt fält och användningskvantitet.
Följande fråga returnerar till exempel rätt användningskvantitet varje timme som är relaterad till en job_id
, även om korrigeringar har gjorts. Genom att aggregera användningskvantiteten negerar återdragningsposten den ursprungliga posten och endast omräkningsvärdena returneras.
SELECT
usage_metadata.job_id, usage_start_time, usage_end_time,
SUM(usage_quantity) as usage_quantity
FROM system.billing.usage
GROUP BY ALL
HAVING usage_quantity != 0
Kommentar
För korrigeringar där den ursprungliga användningsposten inte borde ha skrivits kan en korrigering bara lägga till en återrullningspost och ingen omskrivningspost.
referens för produktens faktureringsursprung
Vissa Databricks-produkter faktureras under samma delade SKU. För att hjälpa dig att särskilja användningen ger kolumnerna billing_origin_product
och product_features
mer insikt i den specifika produkt och de funktioner som är associerade med användningen.
Kolumnen billing_origin_product
visar den Databricks-produkt som är associerad med användningsposten. Värdena omfattar:
JOBS
DLT
SQL
ALL_PURPOSE
MODEL_SERVING
INTERACTIVE
DEFAULT_STORAGE
VECTOR_SEARCH
LAKEHOUSE_MONITORING
PREDICTIVE_OPTIMIZATION
ONLINE_TABLES
FOUNDATION_MODEL_TRAINING
AGENT_EVALUATION
FINE_GRAIN_ACCESS_CONTROL
APPS
: Kostnader som är kopplade till att skapa och köra Databricks Apps
referens för -produktfunktioner
Kolumnen product_features
är ett objekt som innehåller information om de specifika produktfunktioner som används och innehåller följande nyckel/värde-par:
-
jobs_tier
: värden inkluderarLIGHT
,CLASSIC
ellernull
-
sql_tier
: värden inkluderarCLASSIC
,PRO
ellernull
-
dlt_tier
: värden inkluderarCORE
,PRO
,ADVANCED
ellernull
-
is_serverless
: värden inkluderartrue
ellerfalse
ellernull
-
is_photon
: värden inkluderartrue
ellerfalse
ellernull
-
serving_type
: värden inkluderarMODEL
,GPU_MODEL
,FOUNDATION_MODEL
,FEATURE
ellernull