在清洁室中运行笔记本
重要
此功能目前以公共预览版提供。
本文介绍如何在清洁室中运行笔记本。 笔记本是协作者用来在协作中运行数据分析的界面。
若要了解如何将笔记本添加到清洁室,请参阅创建清洁室。
开始之前
若要在清洁室中运行笔记本,必须担任以下角色:
- 清洁室的所有者或对清洁室拥有
EXECUTE CLEAN ROOM TASK
权限。 - 未创建笔记本的协作者。 笔记本创建者无法运行笔记本。 这将强制双方隐式批准笔记本。
注意
创建者在其 Databricks 帐户中会自动分配为清洁室的所有者。 协作者组织的元存储管理员会自动分配为其 Databricks 帐户中清洁室的所有者。 你可以转让所有权。 请参阅管理 Unity Catalog 对象所有权。
在清洁室中运行笔记本
若要在清洁室中运行笔记本,必须使用目录资源管理器。
在 Azure Databricks 工作区中,单击 “目录”。
在“目录”窗格顶部,单击 齿轮图标,然后选择“清洁室”。
或者,在“快速访问”页中,单击“清洁室 >”按钮。
从列表中选择清洁室。
在“笔记本”下,单击笔记本以在预览模式下将其打开。
单击“运行”按钮。
只能运行其他协作者共享的笔记本。
(可选)在“运行包含参数的笔记本”对话框中,单击“+ 添加”将参数值传递给笔记本作业任务。
有关作业任务参数的详细信息,请参阅参数化作业。
单击确认复选框。
单击 “运行” 。
单击“查看详细信息”以查看运行进度。
或者,可以通过转到此页面上的“运行”,或单击工作区边栏中的“工作流”并转到“作业运行”选项卡来查看运行进度。
查看笔记本运行的结果。
运行完成后会显示笔记本结果。 若要查看过去的运行,请转到“运行”并单击“开始时间”列中的链接。
使用输出表共享笔记本输出
输出表是笔记本运行生成的临时只读表,并共享到笔记本运行程序的元存储。 如果笔记本创建输出表,则笔记本运行程序可以在输出目录中访问它,并将其与工作区中的其他用户共享。 请参阅 在 Databricks Clean Room 中创建和使用输出表。
使用 Azure Databricks 工作流运行清理室笔记本
可以使用 Azure Databricks 作业来运行笔记本并在输出表上执行任务,从而生成涉及清理室资产的复杂工作流。 这些功能尤其使此类工作流成为可能:
- 使用 “清理室”笔记本任务类型 ,可以选择并运行清理室笔记本作为工作流任务。 有关作业,请参阅“清理室”笔记本任务。
- 工作流启动的笔记本运行可以生成 可由其他工作流任务引用的输出表 。 请参阅 在 Databricks Clean Room 中创建和使用输出表。
- 工作流可以使用 任务值将作业参数值 传递给清理室笔记本或捕获清理室笔记本输出,并将该输出传递给其他工作流任务。 请参阅使用任务值在任务之间传递信息。
例如,可以创建一个工作流,通过执行以下操作,跨任务传播动态生成的输出架构名称:
创建任务类型 “清理室”笔记本 的任务,该笔记本运行包含以下任务值设置的笔记本:
dbutils.jobs.taskValues.set(key="output_schema", value=dbutils.widgets.get("cr_output_schema"))
创建一个后续任务,该任务引用
output_schema
用于处理输出的值。