Запуск записных книжек в чистых комнатах
В этой статье описывается, как запускать записные книжки в чистых комнатах. Записные книжки — это интерфейс, используемый сотрудниками для выполнения анализа данных в совместной работе.
Сведения о добавлении записной книжки в чистую комнату см. в статье "Создание чистых комнат".
Подготовка к работе
Чтобы запустить записную книжку в чистой комнате, необходимо:
- Владелец чистой комнаты или имеет
EXECUTE CLEAN ROOM TASK
привилегию на чистую комнату. - Сотрудник, который не создавал записную книжку. Создатель записной книжки не может запустить записную книжку. Это обеспечивает неявное утверждение записной книжки обеими сторонами.
Примечание.
Создатель автоматически назначается владельцем чистой комнаты в учетной записи Databricks. Администратор хранилища метаданных организации совместной работы автоматически назначает владение чистой комнатой в учетной записи Databricks. Вы можете передать владение. См. раздел Управление владельцем объекта каталога Unity.
Запуск записной книжки в чистой комнате
Чтобы запустить записную книжку в чистой комнате, необходимо использовать обозреватель каталогов.
В рабочей области Azure Databricks щелкните "Каталог".
В верхней части области каталога щелкнитезначок шестеренки и выберите "Чистые комнаты".
Кроме того, на странице быстрого доступа нажмите кнопку "Чистые комнаты > ".
Выберите чистую комнату из списка.
В разделе "Записные книжки" щелкните записную книжку, чтобы открыть ее в режиме предварительной версии.
Нажмите кнопку Запуск.
Вы можете запускать только записные книжки, к которым предоставлен общий доступ другой сотрудник.
(Необязательно) В диалоговом окне "Запуск записной книжки с параметрами" нажмите кнопку +Добавить, чтобы передать значения параметров задаче задания записной книжки.
Установите флажок подтверждения.
Щелкните Выполнить.
Щелкните "Просмотреть сведения" , чтобы просмотреть ход выполнения.
Кроме того, можно просмотреть ход выполнения, перейдя на эту страницу или щелкнув рабочие процессы на боковой панели рабочей области и перейдя на вкладку "Выполнение задания".
Просмотрите результаты выполнения записной книжки.
Результаты записной книжки отображаются после завершения выполнения. Чтобы просмотреть прошлые запуски, перейдите к разделу "Запуски " и щелкните ссылку в столбце "Время начала".
Примечание.
Параметры cr_creator_input_catalog
и cr_collaborator_input_catalog
автоматически передаются в журнал чистого помещения во время выполнения. Эти параметры можно использовать для локальных тестов с примерами таблиц. Дополнительные сведения о параметрах для задач задания см. в разделе "Параметризация заданий".
Общий доступ к выходным данным записной книжки с помощью выходных таблиц
Выходные таблицы — это временные таблицы только для чтения, созданные запуском записной книжки и общим хранилищем метаданных запуска записной книжки. Если записная книжка создает выходную таблицу, средство выполнения записных книжек может получить доступ к нему в выходном каталоге и поделиться им с другими пользователями в своей рабочей области. См. статью "Создание и работа с выходными таблицами" в чистых комнатах Databricks.
Использование рабочих процессов Azure Databricks для запуска записных книжек чистых помещений
Задания Azure Databricks можно использовать для запуска записных книжек и выполнения задач в выходных таблицах, что позволяет создавать сложные рабочие процессы, включающие ресурсы чистых помещений. Эти функции, в частности, делают такие рабочие процессы возможными:
- Тип задачи "Записная книжка "Чистая комната" позволяет выбрать и запустить записную книжку чистого помещения в качестве задачи "Рабочие процессы". См . задачу записной книжки "Чистая комната" для заданий.
- Запуски записной книжки, инициированной рабочим процессом, могут создавать выходные таблицы , на которые можно ссылаться другими задачами рабочего процесса. См. статью "Создание и работа с выходными таблицами" в чистых комнатах Databricks.
- Рабочие процессы могут использовать значения задач, которые передают значения параметров задания для очистки записных книжек помещений или записи выходных данных записной книжки чистого помещения и передачи выходных данных в другие задачи рабочего процесса. См. раздел "Использование значений задач для передачи сведений между задачами".
- Имя схемы выходных данных чистой комнаты создается автоматически. Если вы включаете
{{tasks.<your_task_name>.output.schema_name}}
и{{tasks.<your_task_name>.output.catalog_name}}
в параметры, вы можете ссылаться на эти значения из чистой комнаты при запуске в нижней задаче записной книжки. Перейдите к задаче записной книжки и в разделе Параметрывыберите значения.
Например, можно создать рабочий процесс, распространяющий имя динамической выходной схемы между задачами, выполнив следующие действия:
Создайте задачу типа записной книжки "Чистые комнаты", которая запускает записную книжку со следующим параметром значения задачи:
dbutils.jobs.taskValues.set(key="output_schema", value=dbutils.widgets.get("cr_output_schema"))
Создайте следующую задачу, которая ссылается на
output_schema
значение для обработки выходных данных.
Примечание.
Чтобы участвовать в закрытой предварительной версии для совместного использования федеративных таблиц, обратитесь к представителю учетной записи Azure Databricks. См. Что такое Федерация Lakehouse?.