Поделиться через


Управление форматом записной книжки

В этой статье описывается формат записной книжки по умолчанию в Azure Databricks, изменение формата записной книжки и управление фиксациями, если записная книжка находится в папке, управляемой источником.

По умолчанию записные книжки в Databricks создаются в формате .ipynb (IPython или Jupyter). Вместо этого можно использовать исходный формат.

Вы по-прежнему можете импортировать и экспортировать записные книжки в различных форматах. См. экспорт и импорт записных книжек Databricks.

Форматы записных книжек

Databricks поддерживает создание и редактирование записных книжек в двух форматах: IPYNB (по умолчанию) и источник.

Вы можете управлять исходными файлами, включая записные книжки, с помощью папок Git. В папках Git поддерживаются только определенные типы ресурсов Databricks. Формат записной книжки влияет на то, какие выходные данные фиксируются в удаленном репозитории, как описано в таблице ниже.

Формат источника блокнота Подробности
источник Базовый формат, который записывает только исходный код с суффиксом, который сигнализирует языку кода, например .py, .scala, .r и .sql.
IPYNB (Jupyter) Богатый формат, который включает исходный код, среду записной книжки, определения визуализаций, виджеты для записной книжки и опциональные выходные данные. Ноутбук IPYNB может содержать код на любом языке, который поддерживается в ноутбуках Databricks (вопреки части pyиз .ipynb). Формат IPYNB (Jupyter) позволяет пользователю при необходимости зафиксировать выходные данные. IPYNB также поддерживает более эффективное просмотр записных книжек Databricks в удаленных репозиториях Git.

Чтобы отличить записные книжки Databricks от обычных файлов Python, Scala и SQL, Azure Databricks добавляет комментарий "Databricks notebook source" в начало записных книжек Python, Scala и SQL. Этот комментарий гарантирует, что Azure Databricks правильно анализирует файл как записную книжку, а не файл скрипта.

Заметка

Что такое "выходные данные"?

Выходные данные — это результаты выполнения блокнота на платформе Databricks, включая отображение таблиц и визуализации.

Изменение параметра формата записной книжки по умолчанию

Записные книжки IPYNB — это формат по умолчанию при создании новой записной книжки в Azure Databricks.

Чтобы изменить формат источника Azure Databricks по умолчанию, войдите в рабочую область Azure Databricks, щелкните ваш профиль в правом верхнем углу страницы, затем выберите Параметры и перейдите в раздел Разработчик. Измените формат записной книжки, используемый по умолчанию, в параметрах редактора под заголовком .

Изменить формат записной книжки по умолчанию в настройках разработчика вашего профиля

Преобразование формата записной книжки

Вы можете преобразовать существующую записную книжку в другой формат с помощью пользовательского интерфейса Azure Databricks.

Чтобы преобразовать существующую записную книжку в другой формат:

  1. Откройте записную книжку в рабочей области.

  2. Выберите файл в меню рабочей области, а затем выберите формат записной книжки, а затем выберите нужный формат. Вы можете выбрать либо Jupyter (.ipynb) (рекомендуется), либо исходный код (.scala, .py, .sql, .r). Текущий формат записной книжки отображается серым цветом и с галочкой рядом.

    файловое меню рабочей области в развернутом виде, отображающее опцию формата записной книжки.

Для получения дополнительной информации о типах записных книжек, поддерживаемых в Azure Databricks, прочитайте раздел «Экспорт и импорт записных книжек Databricks».

Управление коммитами выходных данных блокнота IPYNB

Для записных книжек IPYNB в папках, управляемых источником, можно управлять фиксацией выходных данных записной книжки в удаленном репозитории.

Разрешить сохранение выходных данных записной книжки .ipynb

Выходные данные могут быть зафиксированы только в том случае, если администратор рабочей области включил эту функцию. По умолчанию административный параметр для папок Git не позволяет зафиксировать выходные данные записной книжки .ipynb. Если у вас есть права администратора для рабочей области, можно изменить этот параметр:

  1. Перейдите к параметрам администрирования и параметрам рабочей области> в консоли администрирования Azure Databricks.

  2. В разделе папок Gitвыберите Разрешить папки Git экспортировать выходные данные IPYNB, а затем выберите Разрешить: выходные данные IPYNB можно включить в.

    Консоль администратора: разрешить папкам Git экспортировать результаты IPYNB.

Важный

Если выходные данные включены, конфигурации визуализации и панели мониторинга включаются в создаваемые вами ноутбуки.ipynb.

Контроль фиксирования выходных артефактов записной книжки IPYNB

При коммите файла .ipynb Databricks создает файл конфигурации, который позволяет вам управлять коммитом выходных данных: .databricks/commit_outputs.

  1. Если у вас есть файл записной книжки , но файл конфигурации в удаленном репозитории отсутствует, перейдите в диалоговое окно состояния Git.

  2. В диалоговом окне уведомлений выберите Создать commit_outputs файл.

    пользовательский интерфейс фиксации записной книжки: кнопка создания файла commit_outputs.

Вы также можете создать файлы конфигурации из меню Файл. В меню файла есть элемент управления для автоматического обновления файла конфигурации, в котором можно указать включение или исключение выводов для определенного ноутбука IPYNB.

  1. В меню Файл выберите Фиксация вывода записных книжек.

    Редактор записных книжек: Сохранение состояния вывода и элементов управления.

  2. В диалоговом окне подтвердите ваш выбор зафиксировать выходные данные ноутбука.

    Диалоговое окно фиксации выходных данных записных книжек.