event_log
funkcja wartości tabeli
Dotyczy: Databricks SQL Databricks Runtime 13.3 LTS i nowsze
Zwraca dziennik zdarzeń dla zmaterializowanych widoków, tabel strumieniowych i potoków przetwarzania DLT.
Dowiedz się więcej o Delta Live Tables w dzienniku zdarzeń.
Uwaga
Funkcja wartości tabeli event_log
może być wywoływana tylko przez właściciela tabeli przesyłania strumieniowego lub zmaterializowanego widoku, a widok utworzony na funkcji zwracającej wartości tabeli event_log
może być odpytywany tylko przez właściciela tabeli przesyłania strumieniowego lub zmaterializowanego widoku. Nie można udostępnić widoku innym użytkownikom.
Składnia
event_log( { TABLE ( table_name ) | pipeline_id } )
Argumenty
- table_name: nazwa zmaterializowanego widoku lub tabeli strumieniowej. Nazwa nie może zawierać specyfikacji czasowej. Jeśli nazwa nie jest kwalifikowana, bieżący wykaz i schemat są używane do kwalifikowania identyfikatora.
-
pipeline_id
: identyfikator ciągu znaków dla potoku Delta Live Tables.
Zwraca
-
id STRING NOT NULL
: unikatowy identyfikator rekordu dziennika zdarzeń. -
sequence STRING NOT NULL
: obiekt JSON zawierający metadane służące do identyfikowania i zamawiania zdarzeń. -
origin STRING NOT NULL
: obiekt JSON zawierający metadane dla źródła zdarzenia, na przykład dostawca usług w chmurze, region,user_id
lubpipeline_id
. -
timestamp TIMESTAMP NOT NULL
: godzina zarejestrowania zdarzenia w formacie UTC. -
message STRING NOT NULL
: Czytelny dla człowieka komunikat opisujący zdarzenie. -
level STRING NOT NULL
: poziom rejestrowania, na przykładINFO
, ,WARN
ERROR
lubMETRICS
. -
maturity_level STRING NOT NULL
: stabilność schematu zdarzeń. Możliwe wartości to:-
STABLE
: schemat jest stabilny i nie zmieni się. -
NULL
: schemat jest stabilny i nie zmieni się. Wartość może byćNULL
widoczna, jeśli rekord został utworzony przedmaturity_level
dodaniu pola (wersja 2022.37). -
EVOLVING
: schemat nie jest stabilny i może ulec zmianie. -
DEPRECATED
: schemat jest przestarzały, a środowisko uruchomieniowe delta Live Tables może w dowolnym momencie przestać produkować to zdarzenie.
-
-
error STRING
: Jeśli wystąpił błąd, szczegóły opisujące błąd. -
details STRING NOT NULL
: obiekt JSON zawierający ustrukturyzowane szczegóły zdarzenia. Jest to pole podstawowe używane do analizowania zdarzeń. -
event_type STRING NOT NULL
: typ zdarzenia.
Przykłady
Aby uzyskać więcej przykładów, zobacz Wykonywanie zapytań dotyczących dziennika zdarzeń.
-- View the events on a materialized view
> SELECT timestamp, message, details
FROM event_log(table(my_mv))
WHERE level in ('INFO', 'WARN', 'ERROR')
ORDER BY timestamp;
timestamp, message, details
---------------------------
2023-08-12 01:03:05.000, 'Flow "my_mv" is STARTING.', '{"flow_progress":{"status":"STARTING"}}'
-- Create a temp view with the latest update to the table/pipeline
> CREATE OR REPLACE TEMP VIEW latest_update AS
SELECT origin.update_id AS id FROM event_log('<pipeline-ID>')
WHERE event_type = 'create_update' ORDER BY timestamp DESC LIMIT 1;
-- Query lineage information
> SELECT
details:flow_definition.output_dataset as output_dataset,
details:flow_definition.input_datasets as input_dataset
FROM
event_log('<pipeline-ID>'),
latest_update
WHERE
event_type = 'flow_definition' AND origin.update_id = latest_update.id;
output_dataset, input_dataset
-----------------------------
customers, null
sales_orders_raw, null
sales_orders_cleaned, ["customers", "sales_orders_raw"]
sales_order_in_la, ["sales_orders_cleaned"]
-- Query data quality expectation history for a streaming table
> WITH expectations_parsed AS (
SELECT
explode(
from_json(
details:flow_progress.data_quality.expectations,
"array<struct<name: string, dataset: string, passed_records: int, failed_records: int>>"
)
) row_expectations
FROM
event_log(table(my_st)),
latest_update
WHERE
event_type = 'flow_progress'
AND origin.update_id = latest_update.id
)
SELECT
row_expectations.dataset as dataset,
row_expectations.name as expectation,
SUM(row_expectations.passed_records) as passing_records,
SUM(row_expectations.failed_records) as failing_records
FROM expectations_parsed
GROUP BY
row_expectations.dataset,
row_expectations.name;
dataset, expectation, passing_records, failing_records
------------------------------------------------------
sales_orders_cleaned, valid_order_number, 4083, 0