Изучение и создание таблиц в DBFS
Внимание
Поддержка этой документации прекращена, она может больше не обновляться. Продукты, службы или технологии, упомянутые в этом контенте, больше не поддерживаются. См. статью "Отправка файлов в Azure Databricks", "Создание или изменение таблицы с помощью отправки файлов" и "Что такое обозреватель каталогов?".
Доступ к устаревшей отправке и созданию таблиц DBFS с помощью пользовательского интерфейса добавления данных. Нажмите кнопку "Создать > базу данных".>
Вы также можете получить доступ к пользовательскому интерфейсу из записных книжек, нажав кнопку "Добавить данные".>
Databricks рекомендует использовать обозреватель каталогов для улучшения взаимодействия с объектами данных и управления списками управления доступом и таблицей создания или изменения таблицы с страницы отправки файлов, чтобы легко получить небольшие файлы в Delta Lake.
Примечание.
Доступность некоторых элементов, описанных в этой статье, зависит от конфигураций рабочей области. Обратитесь к администратору рабочей области или группе учетной записи Azure Databricks.
Импорт данных
Если у вас есть небольшие файлы данных на локальном компьютере, которые требуется проанализировать с помощью Azure Databricks, можно импортировать их в DBFS с помощью пользовательского интерфейса.
Примечание.
Администраторы рабочей области могут отключить эту функцию. Дополнительные сведения см. в разделе "Управление отправкой данных".
Создание таблицы
Вы можете запустить пользовательский интерфейс таблицы DBFS, нажав кнопку "Создать" на боковой панели или кнопку DBFS в пользовательском интерфейсе добавления данных. Вы можете заполнить таблицу из файлов в DBFS или отправить файлы.
С помощью пользовательского интерфейса можно создавать только внешние таблицы.
Выберите источник данных и выполните действия, описанные в соответствующем разделе, чтобы настроить таблицу.
Если администратор рабочей области Azure Databricks отключил параметр "Отправить файл", у вас нет возможности отправлять файлы; вы можете создать таблицы с помощью одного из других источников данных.
Инструкции по отправке файла
- Перетащите файлы в область Файлы или щелкните эту область для просмотра и выбора файлов. После отправки для каждого файла будет отображаться путь. Путь будет выглядеть примерно так:
/FileStore/tables/<filename>-<integer>.<file-type>
. Его можно использовать в записной книжке для считывания данных. - Щелкните Создать таблицу с помощью пользовательского интерфейса.
- В раскрывающемся меню "Кластер" выберите кластер.
Инструкции по DBFS
- Выберите файл.
- Щелкните Создать таблицу с помощью пользовательского интерфейса.
- В раскрывающемся меню "Кластер" выберите кластер.
- Перетащите файлы в область Файлы или щелкните эту область для просмотра и выбора файлов. После отправки для каждого файла будет отображаться путь. Путь будет выглядеть примерно так:
Щелкните Предварительный просмотр таблицы, чтобы просмотреть таблицу.
В поле Имя таблицы при необходимости переопределите имя таблицы по умолчанию. Имя таблицы может содержать только буквенно-цифровые символы в нижнем регистре и знаки подчеркивания, а также должно начинаться с буквы в нижнем регистре или знака подчеркивания.
В поле Создать в базе данных при необходимости переопределите выбранную базу данных
default
.В поле Тип файла при необходимости переопределите выведенный тип файла.
Если файл имеет тип CSV:
- В поле Разделитель столбцов выберите, следует ли переопределить выведенный разделитель.
- Укажите, следует ли использовать первую запись в качестве заголовка столбца.
- Укажите, следует ли выводить схему.
Если файл имеет тип JSON, укажите, содержит ли он несколько строк.
Щелкните Создать таблицу.
Просмотр баз данных и таблиц
Примечание.
Рабочие области с включенным обозревателем каталогов не имеют доступа к устаревшему поведению, описанному ниже.
Щелкните каталог на боковой панели. Azure Databricks выберет работающий кластер, к которому у вас есть доступ. Папка Databases (Базы данных) отображает список баз данных с выбранной базой данных default
. Папка Tables (Таблицы) отображает список таблиц в базе данных default
.
Вы можете изменить кластер в меню Databases (Базы данных), создать пользовательский интерфейс таблицы или просмотреть пользовательский интерфейс таблицы. Например, в меню Databases (Базы данных):
Щелкните стрелку вниз в верхней части папки "Базы данных".
Выберите кластер.
Просмотр сведений о таблице
В представлении сведений о таблице отображаются схема таблицы и выборка данных.
Щелкните каталог на боковой панели.
В папке Databases (Базы данных) щелкните базу данных.
В папке Tables (Таблицы) щелкните имя таблицы.
В раскрывающемся списке "Кластер" при необходимости выберите другой кластер, чтобы отобразить предварительный просмотр таблицы.
Примечание.
При предварительном отображении таблицы запрос Spark SQL выполняется на кластере, выбранном в раскрывающемся списке Кластер. Если в кластере уже выполняется рабочая нагрузка, на загрузку предварительного просмотра таблицы может понадобится больше времени.
Удаление таблицы с помощью пользовательского интерфейса
- Щелкните каталог на боковой панели.
- Щелкните рядом с именем таблицы и нажмите кнопку "Удалить".