Поделиться через


Запуск записных книжек в чистых комнатах

В этой статье описывается, как запускать записные книжки в чистых комнатах. Записные книжки — это интерфейс, используемый сотрудниками для выполнения анализа данных в совместной работе.

Сведения о добавлении записной книжки в чистую комнату см. в статье "Создание чистых комнат".

Подготовка к работе

Чтобы запустить записную книжку в чистой комнате, необходимо:

  • Владелец чистой комнаты или имеет EXECUTE CLEAN ROOM TASK привилегию на чистую комнату.
  • Сотрудник, который не создавал записную книжку. Создатель записной книжки не может запустить записную книжку. Это обеспечивает неявное утверждение записной книжки обеими сторонами.

Примечание.

Создатель автоматически назначается владельцем чистой комнаты в учетной записи Databricks. Администратор хранилища метаданных организации совместной работы автоматически назначает владение чистой комнатой в учетной записи Databricks. Вы можете передать владение. См. раздел Управление владельцем объекта каталога Unity.

Запуск записной книжки в чистой комнате

Чтобы запустить записную книжку в чистой комнате, необходимо использовать обозреватель каталогов.

  1. В рабочей области Azure Databricks щелкните Значок каталога"Каталог".

  2. В верхней части области каталога щелкнитеЗначок шестеренкизначок шестеренки и выберите "Чистые комнаты".

    Кроме того, на странице быстрого доступа нажмите кнопку "Чистые комнаты > ".

  3. Выберите чистую комнату из списка.

  4. В разделе "Записные книжки" щелкните записную книжку, чтобы открыть ее в режиме предварительной версии.

  5. Нажмите кнопку Запуск.

    Вы можете запускать только записные книжки, к которым предоставлен общий доступ другой сотрудник.

  6. (Необязательно) В диалоговом окне "Запуск записной книжки с параметрами" нажмите кнопку +Добавить, чтобы передать значения параметров задаче задания записной книжки.

  7. Установите флажок подтверждения.

  8. Щелкните Выполнить.

  9. Щелкните "Просмотреть сведения" , чтобы просмотреть ход выполнения.

    Кроме того, можно просмотреть ход выполнения, перейдя на эту страницу или щелкнув рабочие процессы на боковой панели рабочей области и перейдя на вкладку "Выполнение задания".

  10. Просмотрите результаты выполнения записной книжки.

    Результаты записной книжки отображаются после завершения выполнения. Чтобы просмотреть прошлые запуски, перейдите к разделу "Запуски " и щелкните ссылку в столбце "Время начала".

Примечание.

Параметры cr_creator_input_catalog и cr_collaborator_input_catalog автоматически передаются в журнал чистого помещения во время выполнения. Эти параметры можно использовать для локальных тестов с примерами таблиц. Дополнительные сведения о параметрах для задач задания см. в разделе "Параметризация заданий".

Общий доступ к выходным данным записной книжки с помощью выходных таблиц

Выходные таблицы — это временные таблицы только для чтения, созданные запуском записной книжки и общим хранилищем метаданных запуска записной книжки. Если записная книжка создает выходную таблицу, средство выполнения записных книжек может получить доступ к нему в выходном каталоге и поделиться им с другими пользователями в своей рабочей области. См. статью "Создание и работа с выходными таблицами" в чистых комнатах Databricks.

Использование рабочих процессов Azure Databricks для запуска записных книжек чистых помещений

Задания Azure Databricks можно использовать для запуска записных книжек и выполнения задач в выходных таблицах, что позволяет создавать сложные рабочие процессы, включающие ресурсы чистых помещений. Эти функции, в частности, делают такие рабочие процессы возможными:

  • Тип задачи "Записная книжка "Чистая комната" позволяет выбрать и запустить записную книжку чистого помещения в качестве задачи "Рабочие процессы". См . задачу записной книжки "Чистая комната" для заданий.
  • Запуски записной книжки, инициированной рабочим процессом, могут создавать выходные таблицы , на которые можно ссылаться другими задачами рабочего процесса. См. статью "Создание и работа с выходными таблицами" в чистых комнатах Databricks.
  • Рабочие процессы могут использовать значения задач, которые передают значения параметров задания для очистки записных книжек помещений или записи выходных данных записной книжки чистого помещения и передачи выходных данных в другие задачи рабочего процесса. См. раздел "Использование значений задач для передачи сведений между задачами".
  • Имя схемы выходных данных чистой комнаты создается автоматически. Если вы включаете {{tasks.<your_task_name>.output.schema_name}} и {{tasks.<your_task_name>.output.catalog_name}} в параметры, вы можете ссылаться на эти значения из чистой комнаты при запуске в нижней задаче записной книжки. Перейдите к задаче записной книжки и в разделе Параметрывыберите значения.

Например, можно создать рабочий процесс, распространяющий имя динамической выходной схемы между задачами, выполнив следующие действия:

  1. Создайте задачу типа записной книжки "Чистые комнаты", которая запускает записную книжку со следующим параметром значения задачи:

    dbutils.jobs.taskValues.set(key="output_schema", value=dbutils.widgets.get("cr_output_schema"))
    
  2. Создайте следующую задачу, которая ссылается на output_schema значение для обработки выходных данных.

Примечание.

Чтобы участвовать в закрытой предварительной версии для совместного использования федеративных таблиц, обратитесь к представителю учетной записи Azure Databricks. См. Что такое Федерация Lakehouse?.