清洁室事件系统表参考
清理室事件表记录帐户中你或协作者在干净聊天室(公共预览版)上执行的操作。 此表包含帐户中的区域数据。
有关清洁室的详细信息,请参阅什么是 Azure Databricks 清洁室?。
表路径:此系统表位于 clean_room_events
.
清洁室事件系统表架构
清洁室事件系统表使用以下架构:
列名称 | 数据类型 | 说明 | 示例 |
---|---|---|---|
account_id |
string | Databricks 帐户的 ID | 7af234db-66d7-4db3 -bbf0-956098224879 |
metastore_id |
string | Unity Catalog 元存储的 ID | 5a31ba44-bbf4-4174 -bf33-e1fa078e6765 |
event_id |
string | 清洁室事件的 ID | db52a413-7a0a-4d49 -b742-7ae5f06bc4b2 |
clean_room_name |
string | 与事件关联的清洁室的名称 | market-analysis |
central_clean_room_id |
string | 中央清洁室的 ID | e01b6a78-1336-47e1 -b63d-3e49aa5b627 |
initiator_global_metastore_id |
string | 发起事件的协作者的全局元存储 ID | aws:us-west-2:ec22936d -cd29-4421-a88a-883fb356776a |
event_time |
timestamp | 事件发生时的时间戳 | 2023-01-01T01:01:01.123 |
event_type |
string | 事件类型。 请参阅记录的清洁室事件。 | CLEAN_ROOM_CREATED |
clean_room_created_metadata |
struct | 事件类型 CLEAN_ROOM_CREATED 的元数据 |
{ "collaborators": [ {"collaborator_global_metastore_id": "aws:us-west-2:ec22936d-cd29-4421-a88a-883fb356776a"}, {"collaborator_global_metastore_id": "azure:wesus:”3be05a26-5a83-478c-8428-9ef9aa67b5d0"}] } |
clean_room_deleted_metadata |
struct | 事件类型 CLEAN_ROOM_DELETED 的元数据 |
{ "central_clean_room_id": "af0d4563-2267-412c-9d4a -8a59c4895c18" } |
run_notebook_started_metadata |
struct | 事件类型 RUN_NOTEBOOK_STARTED 的元数据 |
{ "notebook_name": "market analysis", "notebook_checksum": "7072696E7468656C6C6F776F7264", "run_id": "TaskRunId-634124444694206" } |
run_notebook_completed_metadata |
struct | 事件类型 RUN_NOTEBOOK_COMPLETED 的元数据 |
{ "notebook_name": "market analysis", "run_id": "TaskRunId-634124444694206", "state": "SUCCESS", "duration_in_seconds": 156 } |
clean_room_assets_updated |
struct | 事件类型 CLEAN_ROOM_ASSETS_UPDATED 的元数据 |
{ "added_assets": [{ "data_object_type": "TABLE", "name": "sales", "catalog": "demo"}], "updated_assets":[], "removed_assets": [] } |
记录的清洁室事件
此系统表会记录以下事件:
CLEAN_ROOM_CREATED
:用户新建清洁室CLEAN_ROOM_DELETED
:用户删除清洁室RUN_NOTEBOOK_STARTED
:用户在清洁室中启动笔记本RUN_NOTEBOOK_COMPLETED
:已完成笔记本运行。 检查run_notebook_completed_metadata
以查看运行是否成功。CLEAN_ROOM_ASSETS_UPDATED
:清洁室的资产已更新。 这可以是添加、更新或删除资产。
监视清洁室可计费使用情况
若要了解有关清洁室使用情况和成本的详细信息,可以使用 central_clean_room_id
列将此表与 billing.usage
表联接。 在 billing.usage
表中,清洁室的使用情况是使用 usage_metadata.central_clean_room_id
键进行归因的。
示例查询
以下示例查询可帮助你深入了解帐户中的清洁室活动:
列出指定清洁室中的所有事件
注意
将 <clean_room_name>
替换为指定的清洁室名称。
SELECT
event_time, initiator_global_metastore_id, event_type,
CASE
WHEN event_type = 'CLEAN_ROOM_CREATED' THEN to_json(clean_room_created_metadata)
WHEN event_type = 'CLEAN_ROOM_DELETED' THEN to_json(clean_room_deleted_metadata)
WHEN event_type = 'RUN_NOTEBOOK_STARTED' THEN to_json(run_notebook_started_metadata)
WHEN event_type = 'RUN_NOTEBOOK_COMPLETED' THEN to_json(run_notebook_completed_metadata)
WHEN event_type = 'CLEAN_ROOM_ASSETS_UPDATED' THEN to_json(clean_room_assets_updated_metadata)
ELSE ""
END AS event_metadata
FROM system.access.clean_room_events
WHERE clean_room_name = '<clean_room_name>'
ORDER BY event_time DESC
列出指定协作者发起的所有事件
注意
将 <collaborator global metastore ID>
替换为协作者的全局元存储 ID,也称为共享标识符。
SELECT
clean_room_name, event_type, event_time,
CASE
WHEN event_type = 'CLEAN_ROOM_CREATED' THEN to_json(clean_room_created_metadata)
WHEN event_type = 'CLEAN_ROOM_DELETED' THEN to_json(clean_room_deleted_metadata)
WHEN event_type = 'RUN_NOTEBOOK_STARTED' THEN to_json(run_notebook_started_metadata)
WHEN event_type = 'RUN_NOTEBOOK_COMPLETED' THEN to_json(run_notebook_completed_metadata)
WHEN event_type = 'CLEAN_ROOM_ASSETS_UPDATED' THEN to_json(clean_room_assets_updated_metadata)
ELSE ""
END AS event_metadata
FROM system.access.clean_room_events
WHERE initiator_global_metastore_id = '<collaborator global metastore ID>'
ORDER BY clean_room_name, event_time DESC
列出清洁室的所有相关协作者
SELECT DISTINCT explode(transform(clean_room_created_metadata.collaborators, x -> x.collaborator_global_metastore_id)) AS collaborator
FROM system.access.clean_room_events
WHERE event_type = 'CLEAN_ROOM_CREATED'
列出速度最慢的笔记本运行
SELECT
clean_room_name,
run_notebook_completed_metadata.notebook_name AS notebook_name,
run_notebook_completed_metadata.duration_in_seconds AS duration_in_seconds,
run_notebook_completed_metadata.run_id AS run_id
FROM system.access.clean_room_events
WHERE event_type = 'RUN_NOTEBOOK_COMPLETED'
AND run_notebook_completed_metadata.state = 'SUCCESS'
AND run_notebook_completed_metadata.duration_in_seconds IS NOT NULL
ORDER BY duration_in_seconds DESC
每个笔记本的成功运行率
SELECT
clean_room_name,
run_notebook_completed_metadata.notebook_name AS notebook_name,
ROUND(COUNT(CASE WHEN run_notebook_completed_metadata.state = 'SUCCESS' THEN 1 END) * 1.0 / COUNT(*) * 100) AS success_rate
FROM system.access.clean_room_events
WHERE event_type = 'RUN_NOTEBOOK_COMPLETED'
GROUP BY clean_room_name, notebook_name
ORDER BY clean_room_name, notebook_name
列出已将指定表添加到清洁室的所有事件
注意
将表名 default.sales
替换为指定的表名。
SELECT
clean_room_name, initiator_global_metastore_id, event_time, clean_room_assets_updated_metadata
FROM system.access.clean_room_events
WHERE event_type = 'CLEAN_ROOM_ASSETS_UPDATED'
AND exists(clean_room_assets_updated_metadata.added_assets, item -> item.data_object_type = 'TABLE' AND item.name = 'default.sales')
ORDER BY clean_room_name, event_time DESC