Управление форматом записной книжки
В этой статье описывается формат записной книжки по умолчанию в Azure Databricks, изменение формата записной книжки и управление фиксациями, если записная книжка находится в папке, управляемой источником.
По умолчанию записные книжки в Databricks создаются в формате .ipynb
(IPython или Jupyter). Вместо этого можно использовать исходный формат.
Вы по-прежнему можете импортировать и экспортировать записные книжки в различных форматах. См. экспорт и импорт записных книжек Databricks.
Форматы записных книжек
Databricks поддерживает создание и редактирование записных книжек в двух форматах: IPYNB (по умолчанию) и источник.
Вы можете управлять исходными файлами, включая записные книжки, с помощью папок Git. В папках Git поддерживаются только определенные типы ресурсов
Формат источника блокнота | Подробности |
---|---|
источник | Базовый формат, который записывает только исходный код с суффиксом, который сигнализирует языку кода, например .py , .scala , .r и .sql . |
IPYNB (Jupyter) | Богатый формат, который включает исходный код, среду записной книжки, определения визуализаций, виджеты для записной книжки и опциональные выходные данные. Ноутбук IPYNB может содержать код на любом языке, который поддерживается в ноутбуках Databricks (вопреки части py из .ipynb ). Формат IPYNB (Jupyter) позволяет пользователю при необходимости зафиксировать выходные данные. IPYNB также поддерживает более эффективное просмотр записных книжек Databricks в удаленных репозиториях Git. |
Чтобы отличить записные книжки Databricks от обычных файлов Python, Scala и SQL, Azure Databricks добавляет комментарий "Databricks notebook source
" в начало записных книжек Python, Scala и SQL. Этот комментарий гарантирует, что Azure Databricks правильно анализирует файл как записную книжку, а не файл скрипта.
Заметка
Что такое "выходные данные"?
Выходные данные — это результаты выполнения блокнота на платформе Databricks, включая отображение таблиц и визуализации.
Изменение параметра формата записной книжки по умолчанию
Записные книжки IPYNB — это формат по умолчанию при создании новой записной книжки в Azure Databricks.
Чтобы изменить формат источника Azure Databricks по умолчанию, войдите в рабочую область Azure Databricks, щелкните ваш профиль в правом верхнем углу страницы, затем выберите Параметры и перейдите в раздел Разработчик. Измените формат записной книжки, используемый по умолчанию, в параметрах редактора под заголовком .
Преобразование формата записной книжки
Вы можете преобразовать существующую записную книжку в другой формат с помощью пользовательского интерфейса Azure Databricks.
Чтобы преобразовать существующую записную книжку в другой формат:
Откройте записную книжку в рабочей области.
Выберите файл в меню рабочей области, а затем выберите формат записной книжки, а затем выберите нужный формат. Вы можете выбрать либо Jupyter (.ipynb) (рекомендуется), либо исходный код (.scala, .py, .sql, .r). Текущий формат записной книжки отображается серым цветом и с галочкой рядом.
Для получения дополнительной информации о типах записных книжек, поддерживаемых в Azure Databricks, прочитайте раздел «Экспорт и импорт записных книжек Databricks».
Управление коммитами выходных данных блокнота IPYNB
Для записных книжек IPYNB в папках, управляемых источником, можно управлять фиксацией выходных данных записной книжки в удаленном репозитории.
Разрешить сохранение выходных данных записной книжки .ipynb
Выходные данные могут быть зафиксированы только в том случае, если администратор рабочей области включил эту функцию. По умолчанию административный параметр для папок Git не позволяет зафиксировать выходные данные записной книжки .ipynb
. Если у вас есть права администратора для рабочей области, можно изменить этот параметр:
Перейдите к параметрам администрирования и параметрам рабочей области> в консоли администрирования Azure Databricks.
В разделе папок Gitвыберите Разрешить папки Git экспортировать выходные данные IPYNB, а затем выберите Разрешить: выходные данные IPYNB можно включить в.
Важный
Если выходные данные включены, конфигурации визуализации и панели мониторинга включаются в создаваемые вами ноутбуки.ipynb
.
Контроль фиксирования выходных артефактов записной книжки IPYNB
При коммите файла .ipynb
Databricks создает файл конфигурации, который позволяет вам управлять коммитом выходных данных: .databricks/commit_outputs
.
Если у вас есть файл записной книжки
, но файл конфигурации в удаленном репозитории отсутствует, перейдите в диалоговое окно состояния Git. В диалоговом окне уведомлений выберите Создать commit_outputs файл.
Вы также можете создать файлы конфигурации из меню Файл. В меню файла
В меню Файл выберите Фиксация вывода записных книжек.
В диалоговом окне подтвердите ваш выбор зафиксировать выходные данные ноутбука.