在清洁室中运行笔记本

重要

此功能目前以公共预览版提供。

本文介绍如何在清洁室中运行笔记本。 笔记本是协作者用来在协作中运行数据分析的界面。

若要了解如何将笔记本添加到清洁室,请参阅创建清洁室

开始之前

若要在清洁室中运行笔记本,必须担任以下角色:

  • 清洁室的所有者或对清洁室拥有 EXECUTE CLEAN ROOM TASK 权限。
  • 未创建笔记本的协作者。 笔记本创建者无法运行笔记本。 这将强制双方隐式批准笔记本。

注意

创建者在其 Databricks 帐户中会自动分配为清洁室的所有者。 协作者组织的元存储管理员会自动分配为其 Databricks 帐户中清洁室的所有者。 你可以转让所有权。 请参阅管理 Unity Catalog 对象所有权

在清洁室中运行笔记本

若要在清洁室中运行笔记本,必须使用目录资源管理器。

  1. 在 Azure Databricks 工作区中,单击 “目录”图标“目录”。

  2. 在“目录”窗格顶部,单击 齿轮图标 齿轮图标,然后选择“清洁室”。

    或者,在“快速访问”页中,单击“清洁室 >”按钮。

  3. 从列表中选择清洁室。

  4. 在“笔记本”下,单击笔记本以在预览模式下将其打开。

  5. 单击“运行”按钮。

    只能运行其他协作者共享的笔记本。

  6. (可选)在“运行包含参数的笔记本”对话框中,单击“+ 添加将参数值传递给笔记本作业任务。

    有关作业任务参数的详细信息,请参阅参数化作业

  7. 单击确认复选框。

  8. 单击 “运行”

  9. 单击“查看详细信息”以查看运行进度。

    或者,可以通过转到此页面上的“运行”,或单击工作区边栏中的“工作流”并转到“作业运行”选项卡来查看运行进度

  10. 查看笔记本运行的结果。

    运行完成后会显示笔记本结果。 若要查看过去的运行,请转到“运行”并单击“开始时间”列中的链接

使用输出表共享笔记本输出

输出表是笔记本运行生成的临时只读表,并共享到笔记本运行程序的元存储。 如果笔记本创建输出表,则笔记本运行程序可以在输出目录中访问它,并将其与工作区中的其他用户共享。 请参阅 在 Databricks Clean Room 中创建和使用输出表。

使用 Azure Databricks 工作流运行清理室笔记本

可以使用 Azure Databricks 作业来运行笔记本并在输出表上执行任务,从而生成涉及清理室资产的复杂工作流。 这些功能尤其使此类工作流成为可能:

  • 使用 “清理室”笔记本任务类型 ,可以选择并运行清理室笔记本作为工作流任务。 有关作业,请参阅“清理室”笔记本任务。
  • 工作流启动的笔记本运行可以生成 可由其他工作流任务引用的输出表 。 请参阅 在 Databricks Clean Room 中创建和使用输出表。
  • 工作流可以使用 任务值将作业参数值 传递给清理室笔记本或捕获清理室笔记本输出,并将该输出传递给其他工作流任务。 请参阅使用任务值在任务之间传递信息

例如,可以创建一个工作流,通过执行以下操作,跨任务传播动态生成的输出架构名称:

  1. 创建任务类型 “清理室”笔记本 的任务,该笔记本运行包含以下任务值设置的笔记本:

    dbutils.jobs.taskValues.set(key="output_schema", value=dbutils.widgets.get("cr_output_schema"))
    
  2. 创建一个后续任务,该任务引用 output_schema 用于处理输出的值。