Экспорт и импорт записных книжек Databricks
На этой странице описывается, как импортировать и экспортировать записные книжки в Azure Databricks и форматы записных книжек, поддерживаемые Azure Databricks.
Поддерживаемые форматы записных книжек
Databricks может импортировать и экспортировать записные книжки в следующих форматах.
- Исходный файл: файл, содержащий только инструкции исходного кода с расширением
.scala
,.py
,.sql
или.r
. - HTML: записная книжка Azure Databricks с расширением
.html
. - Архив Databricks
.dbc
. - Записная книжка IPython: записная книжка Jupyter с расширением
.ipynb
. - RMarkdown: документ R Markdown с расширением
.Rmd
.
Импорт записной книжки
Вы можете импортировать внешнюю записную книжку из URL-адреса или файла. Также можно импортировать ZIP-архив записных книжек, экспортированных группой из рабочей области Azure Databricks.
- Щелкните рабочую область на боковой панели. Выполните одно из следующих действий:
- Щелкните правой кнопкой мыши папку и выберите "Импорт".
- Чтобы импортировать записную книжку на верхнем уровне текущей папки рабочей области, щелкните меню кебаб в правом верхнем углу и выберите "Импорт".
- Укажите URL-адрес или выберите файл, содержащий поддерживаемый внешний формат или ZIP-архив записных книжек, экспортированных из рабочей области Azure Databricks.
- Нажмите кнопку Импорт.
- Если выбрать одну записную книжку, она будет экспортироваться в текущую папку.
- При выборе DBC или ZIP-архива структура папок создается повторно в текущей папке, импортируется каждая записная книжка.
Импорт файла и его преобразование в записную книжку
Скрипты Python, SQL, Scala и R можно преобразовать в одноэлементные записные книжки, добавив комментарий в первую ячейку файла:
Python
# Databricks notebook source
SQL
-- Databricks notebook source
Scala
// Databricks notebook source
R
# Databricks notebook source
Чтобы определить ячейки в скрипте, используйте специальный комментарий, показанный ниже. При импорте скрипта в Databricks ячейки создаются как отмеченные строками COMMAND
.
Python
# COMMAND ----------
SQL
-- COMMAND ----------
Scala
// COMMAND ----------
R
# COMMAND ----------
Экспорт записных книжек
Примечание.
При экспорте записной книжки в формате HTML записная книжка IPython (IPynb) или архивная (DBC) и вы не очищали выходные данные команды, выходные данные включаются в экспорт.
Чтобы экспортировать записную книжку, выберите "Экспорт файлов>" на панели инструментов записной книжки и выберите формат экспорта.
Чтобы экспортировать все папки в папке рабочей области в виде ZIP-архива, выполните следующие действия:
- Щелкните рабочую область на боковой панели.
- Щелкните правой кнопкой мыши папку и выберите "Экспорт".
- Выберите формат экспорта:
- Архив DBC: экспорт архива Databricks, двоичного формата, включающего выходные данные метаданных и команд записной книжки.
- Исходный файл. Экспорт ZIP-архива исходных файлов записной книжки, который можно импортировать в рабочую область Azure Databricks, используемую в конвейере CI/CD, или просмотреть в виде исходных файлов в соответствии с языком по умолчанию для каждой записной книжки. Выходные данные команды записной книжки не включены.
- Архив HTML. Экспорт ZIP-архива файлов HTML. HTML-файл каждой записной книжки можно импортировать в рабочую область Azure Databricks или просмотреть в формате HTML. Выходные данные команд записной книжки включены.