Accountactiviteit bewaken met systeem tables
In dit artikel wordt het concept van systeem tables in Azure Databricks uitgelegd en worden resources gemarkeerd die u kunt gebruiken om het meeste uit uw systeem tables gegevens te get.
Wat is systeem tables?
Systeem tables is een analytische opslag gehost door Azure Databricks van de operationele gegevens van uw account in de system
catalog. Systeem tables kan worden gebruikt voor historische waarneembaarheid in uw account.
Notitie
Zie Information schemavoor documentatie over system.information_schema
.
Vereisten
Als u toegang wilt krijgen tot het systeem tables, moet uw werkruimte zijn ingeschakeld voor Unity Catalog. Zie Systeem table schema's inschakelenvoor meer informatie.
Systeem tables zijn niet beschikbaar in de volgende regio's:
- Regio's van Azure China
- Azure Government-regio's
- India - west
- Zwitserland - west
Welke systemen tables zijn beschikbaar?
Momenteel host Azure Databricks het volgende systeem tables:
Table | Beschrijving | Locatie | Ondersteunt streaming | Gratis bewaarperiode | Bevat globale of regionale gegevens |
---|---|---|---|---|---|
Auditlogboeken (openbare preview) | Bevat records voor alle controlegebeurtenissen uit werkruimten in uw regio. Voor een list van beschikbare controlegebeurtenissen, zie naslaginformatie over diagnostisch logboek. | system.access.audit |
Ja | 365 dagen | Regionaal voor gebeurtenissen op werkruimteniveau. Globaal voor gebeurtenissen op accountniveau. |
Table herkomst (openbare preview) | Bevat een record voor elke lees- of schrijfbeurt op een Unity-Catalogtable of -pad. | system.access.table_lineage |
Ja | 365 dagen | Regionaal |
Column herkomst (openbare preview) | Bevat een record voor elke lees- of schrijfbeurtenis op een Unity-Catalogcolumn (maar bevat geen gebeurtenissen die geen bron hebben). | system.access.column_lineage |
Ja | 365 dagen | Regionaal |
Factureerbaar gebruik | Bevat records voor alle factureerbare gebruik in uw account. | system.billing.usage |
Ja | 365 dagen | Globaal |
Prijzen | Een historisch logboek met SKU-prijzen. Er wordt elke keer een record toegevoegd wanneer er een wijziging is in een SKU-prijs. | system.billing.list_prices |
Nee | Onbeperkt | Globaal |
Clusters (openbare preview) | Een langzaam veranderende dimensie table die de volledige geschiedenis van rekenconfiguraties in de loop van de tijd voor elk cluster bevat. | system.compute.clusters |
Ja | N.v.t. | Regionaal |
Tijdlijn van knooppunt (openbare preview) | Hiermee worden de metrische gegevens over het gebruik van uw rekenresources voor alle doeleinden en taken vastgelegd. | system.compute.node_timeline |
Ja | 30 dagen | Regionaal |
Knooppunttypen (openbare preview) | Legt de momenteel beschikbare knooppunttypen vast met de basishardwaregegevens. | system.compute.node_types |
Nee | N.v.t. | Regionaal |
SQL-warehouses (openbare preview) | Bevat de volledige geschiedenis van configuraties in de loop van de tijd voor elk SQL-warehouse. | system.compute.warehouses |
Ja | 365 dagen | Regionaal |
SQL Warehouse-gebeurtenissen (openbare preview) | Legt gebeurtenissen vast die betrekking hebben op SQL-warehouses. Bijvoorbeeld: starten, stoppen, uitvoeren, omhoog en omlaag schalen. | system.compute.warehouse_events |
Ja | 365 dagen | Regionaal |
Taken (openbare preview) | Houdt alle taken bij die in het account zijn gemaakt. | system.lakeflow.jobs |
Ja | 365 dagen | Regionaal |
Taaktaken (openbare preview) | Houdt alle taaktaken bij die worden uitgevoerd in het account. | system.lakeflow.job_tasks |
Ja | 365 dagen | Regionaal |
Tijdlijn voor taakuitvoering (openbare preview) | Houdt de begin- en eindtijden van taakuitvoeringen bij. | system.lakeflow. job_run_timeline |
Ja | 365 dagen | Regionaal |
Tijdlijn taaktaak (openbare preview) | Houdt de begin- en eindtijden bij en rekenresources die worden gebruikt voor taakuitvoeringen. | system.lakeflow. job_task_run_timeline |
Ja | 365 dagen | Regionaal |
Marketplace-trechtergebeurtenissen (openbare preview) | Bevat consumentenindrukken en trechtergegevens voor uw vermeldingen. | system.marketplace.listing_ funnel_events |
Ja | 365 dagen | Regionaal |
Toegang tot Marketplace-vermeldingen (openbare preview) | Bevat consumenteninformatie voor voltooide aanvraaggegevens of get gegevens gebeurtenis in uw vermeldingen. | system.marketplace.listing_ access_events |
Ja | 365 dagen | Regionaal |
Voorspellende optimalisatie (openbare preview) | Houdt de bewerkingsgeschiedenis van de functie voorspellende optimalisatie bij. | system.storage.predictive_ optimization_operations_history |
Nee | 180 dagen | Regionaal |
Databricks Assistant-gebeurtenissen (openbare preview) | Houdt gebruikersberichten bij die naar de Databricks Assistant worden verzonden. | system.access.assistant_events |
Nee | 365 dagen | Regionaal |
Querygeschiedenis (openbare preview) | Registreert records voor alle query's die worden uitgevoerd op SQL-warehouses en serverloze berekeningen voor notebooks en taken. | system.query.history |
Nee | 90 dagen | Regionaal |
Clean room events (openbare preview) | Legt gebeurtenissen vast die betrekking hebben op schone ruimten. | system.access.clean_room_events |
Ja | 365 dagen | Regionaal |
Model voor eindpuntgebruik (openbare preview) | Hiermee worden tokenaantallen vastgelegd voor elke aanvraag naar een model dat eindpunt en de bijbehorende antwoorden verwerkt. Om het eindpuntgebruik in deze tablevast te leggen, moet u het bijhouden van gebruik op uw service-eindpuntinschakelen. |
system.serving.endpoint_usage . |
Ja | 90 dagen | Regionaal |
Model voor eindpuntgegevens (openbare preview) | Een langzaam veranderende dimensie table waarin metagegevens worden opgeslagen voor elk geleverd basismodel in een model dat het eindpunt bedient. | system.serving.served_entities |
Ja | 365 dagen | Regionaal |
gebeurtenissen voor netwerktoegang (openbare preview) | Een table die een gebeurtenis registreert voor elke keer dat internettoegang wordt geweigerd vanuit uw account. | system.access.outbound_network |
Ja | 365 dagen | Regionaal |
Het factureerbare gebruik en de prijzen tables zijn gratis te gebruiken. Tables in de openbare preview kunt u ook gratis gebruiken tijdens de preview, maar er kunnen mogelijk in de toekomst kosten in rekening worden gebracht.
Notitie
Mogelijk kunt u andere systemen met tables in uw account zien, naast de hierboven genoemde systemen. Deze tables zijn momenteel beschikbaar als privévoorbeeld en zijn standaard leeg. Als u geïnteresseerd bent in het gebruik van een van deze tables, neemt u contact op met uw Databricks-accountteam.
systeemschema's table inschakelen
Omdat systeem-tables worden beheerd door Unity Catalog, moet u ten minste één Unity Catalog-werkruimte in uw account hebben om systeem-tablesin te schakelen en te openen. Systeem tables bevat gegevens uit alle werkruimtes in uw account, maar ze kunnen alleen worden geopend vanuit een werkruimte met Unity Catalogondersteuning.
Systeem tables is ingeschakeld op het schema niveau. Als u een systeem schemainschakelt, schakelt u alle tables binnen die schemain. Wanneer er nieuwe schema's worden vrijgegeven, moet een accountbeheerder de schemahandmatig inschakelen.
Systeem tables moet worden ingeschakeld door een accountbeheerder. U kunt systeem-tables inschakelen met behulp van system-schemas
opdrachten in de Databricks CLI- of met behulp van de SystemSchemas-API-.
Notitie
De billing
schema is standaard ingeschakeld. Andere schema's moeten handmatig worden ingeschakeld.
List beschikbare systeemschema's
Gebruik de volgende curl-opdracht om beschikbare systeemschema's te list:
curl -v -X GET -H "Authorization: Bearer <PAT Token>" "https://adb-<xxx>.azuredatabricks.net/api/2.0/unity-catalog/metastores/<metastore-id>/systemschemas"
Hier volgt een voorbeeld van de uitvoer van de GET
opdracht:
{"schemas":[{"schema":"access","state":"<AVAILABLE OR EnableCompleted>"},{"schema":"billing","state":"<AVAILABLE OR EnableCompleted>"},{"schema":"information_schema","state":"<AVAILABLE OR EnableCompleted>"}]}
state: AVAILABLE
: het systeem schema is beschikbaar, maar is nog niet ingeschakeld.
state: EnableCompleted
: u hebt het systeem schema ingeschakeld en is zichtbaar in Catalog Explorer.
Een systeem schema inschakelen
Gebruik de volgende curl-opdracht om een systeem schemain te schakelen:
curl -v -X PUT -H "Authorization: Bearer <PAT Token>" "https://adb-<xxx>.azuredatabricks.net/api/2.0/unity-catalog/metastores/<metastore-id>/systemschemas/<SCHEMA_NAME>"
Als het systeem schema met succes is ingeschakeld, wordt resultaatcode 200
geretourneerd.
Als u probeert een systeem schemaopnieuw in te schakelen, wordt het volgende geretourneerd: "error_code":"SCHEMA_ALREADY_EXISTS","message":"Schema <schema-name> already exists"
.
Een systeem schema uitschakelen
Gebruik de volgende curl-opdracht om een systeem schemauit te schakelen:
curl -v -X DELETE -H "Authorization: Bearer <PAT Token>" "https://adb-<xxx>.azuredatabricks.net/api/2.0/unity-catalog/metastores/<metastore-id>/systemschemas/<SCHEMA_NAME>"
Grant toegang tot systeem tables
Toegang tot systeem tables wordt beheerd door Unity Catalog. Gebruikers hebben standaard geen toegang tot deze systeemschema's. Voor grant toegang moet een gebruiker, die zowel metastore-beheerder als accountbeheerder is, grantUSE
en SELECT
machtigingen hebben voor de systeemschema's. Zie Bevoegdheden beheren in Unity Catalog.
Systeem tables is alleen-lezen en kan niet worden gewijzigd.
Notitie
Als uw account is gemaakt na 9 november 2023, hebt u mogelijk geen metastore-beheerder standaard. Voor meer informatie, zie Set en beheer Unity Catalog.
Bevat het systeem tables gegevens voor alle werkruimten in uw account?
Systeem tables operationele gegevens bevatten voor alle werkruimten in uw account die in dezelfde cloudregio zijn geïmplementeerd. Het factureringssysteem tables bevat accountbrede gegevens.
Hoewel systeem-tables alleen toegankelijk zijn via een Unity Catalog-werkruimte, bevatten de tables ook operationele gegevens voor de niet-Unity Catalog werkruimten in uw account.
Waar worden de systeemgegevens table opgeslagen Where?
De table gegevens van uw account wordt opgeslagen in een opslagaccount gehost door Azure Databricks in dezelfde regio als uw metastore. De gegevens worden veilig met u gedeeld met behulp van Delta Sharing.
Elke table heeft een gratis gegevensretentieperiode. Neem contact op met uw Azure Databricks-accountteam voor informatie over het verlengen van de bewaarperiode.
Where bevinden systeem-tables zich in Catalog Explorer?
Het systeem tables in uw account bevindt zich in een catalog genaamd system
, dat is opgenomen in elke Unity Catalog metastore. In de system
catalog ziet u schema's zoals access
en billing
die het systeem tablesbevatten.
Overwegingen voor streamingsysteem tables
Azure Databricks maakt gebruik van Delta Sharing om systeemgegevens te delen table met klanten. Houd rekening met de volgende overwegingen bij het streamen met Delta Sharing:
- Als u streaming gebruikt met systeem tables, set, is de optie
skipChangeCommits
beschikbaar om tetrue
. Dit zorgt ervoor dat de streamingtaak niet wordt onderbroken door verwijderingen in het systeem tables. Zie Updates en verwijderingen negeren. -
Trigger.AvailableNow
wordt niet ondersteund met Delta Sharing-streaming. Het wordt geconverteerd naarTrigger.Once
.
Als u een trigger in uw streamingtaak gebruikt en merkt dat deze niet bij de meest recente table versie van het systeem komt, raadt Databricks aan om de geplande frequentie van de taak te verhogen.
Incrementele wijzigingen lezen van het streamingsysteem tables
spark.readStream.option("skipChangeCommits", "true").table("system.billing.usage")
Bekende problemen
Momenteel is er geen ondersteuning voor realtime bewaking. Gegevens worden de hele dag bijgewerkt. Als u geen logboek ziet voor een recente gebeurtenis, controleert u het later opnieuw.
Het
__internal_logging
systeem tableschema wordt gebruikt om payload-logboekregistratie te ondersteunen met behulp van AI Gateway-geschikte inferentie tables voor externe modellen en workloads voorzien van doorvoercapaciteit. Deze schema is zichtbaar voor accountbeheerders, maar kan niet worden ingeschakeld en mag niet worden gebruikt voor klantwerkstromen.Om systeem tablesin te schakelen, moet u mogelijk netwerktoegang grant tot het blobopslageindpunt van het systeem tables verkrijgen. Om een list van elk regio's systeem tablesopslageindpunt te bekijken, raadpleegt u IP-adressen van opslageindpunten.
De systeemschema's
system.operational_data
ensystem.lineage
zijn afgeschaft en bevatten lege tables.