Поделиться через


Изучение и создание таблиц в DBFS

Внимание

Поддержка этой документации прекращена, она может больше не обновляться. Продукты, службы или технологии, упомянутые в этом контенте, больше не поддерживаются. См. загрузка файлов в Azure Databricks, создание или изменение таблицы с использованием загрузки файлови Что такое Обозреватель каталогов?.

Откройте устаревший интерфейс загрузки файлов и создания таблиц DBFS через интерфейс добавления данных. Нажмите кнопку Значок >>

Вы также можете получить доступ к пользовательскому интерфейсу из записных книжек, нажав >".

Databricks рекомендует использовать Catalog Explorer для улучшенного отображения объектов данных и управления списками контроля доступа, а также страницу создания или изменения таблицы из отправленных файлов для легкой загрузки небольших файлов в Delta Lake.

Примечание.

Доступность некоторых элементов, описанных в этой статье, зависит от конфигураций рабочей области. Обратитесь к администратору рабочей области или группе учетной записи Azure Databricks.

Импорт данных

Если у вас есть небольшие файлы данных на локальном компьютере, которые требуется проанализировать с помощью Azure Databricks, можно импортировать их в DBFS с помощью пользовательского интерфейса.

Примечание.

Администраторы рабочей области могут отключить эту функцию. Дополнительные сведения см. в разделе "Управление отправкой данных".

Создание таблицы

Вы можете запустить пользовательский интерфейс таблицы DBFS, щелкнув новый значоксоздать на боковой панели или кнопку DBFS в добавить пользовательский интерфейс данных. Таблицу можно заполнить из файлов в DBFS или отправить файлы.

С помощью пользовательского интерфейса можно создавать только внешние таблицы .

  1. Выберите источник данных и выполните действия, описанные в соответствующем разделе, чтобы настроить таблицу.

    Если администратор рабочей области Azure Databricks отключил параметр "Загрузить файл", у вас нет возможности загружать файлы; таблицы можно создать с помощью одного из других источников данных.

    Инструкции по отправке файла

    1. Перетащите файлы в область Файлы или щелкните эту область для просмотра и выбора файлов. После отправки для каждого файла будет отображаться путь. Путь будет выглядеть примерно так: /FileStore/tables/<filename>-<integer>.<file-type>. Его можно использовать в записной книжке для считывания данных.
    2. Щелкните Создать таблицу с помощьюпользовательского интерфейса.
    3. В раскрывающемся меню "Кластер" выберите кластер.

    Инструкции по DBFS

    1. Выберите файл.
    2. Щелкните Создать таблицу с помощью пользовательского интерфейса.
    3. В раскрывающемся меню "Кластер" выберите кластер.
  2. Щелкните Предварительный просмотр таблицы, чтобы просмотреть таблицу.

  3. В поле имени таблицы при необходимости переопределите имя таблицы по умолчанию. Имя таблицы может содержать только буквенно-цифровые символы нижнего регистра и символы подчеркивания и должно начинаться с строчной буквы или подчеркивания.

  4. В поле Создать в базе данных при необходимости переопределите выбранную базу данных default.

  5. В поле Тип файла при необходимости переопределите выведенный тип файла.

  6. Если файл имеет тип CSV:

    1. В поле разделителя столбцов выберите, следует ли переопределить предполагаемый разделитель.
    2. Укажите, следует ли использовать первую строку в качестве заголовков столбцов.
    3. Укажите, следует ли выводить схему.
  7. Если файл имеет тип JSON, укажите, содержит ли он несколько строк.

  8. Щелкните Создать таблицу.

Просмотр баз данных и таблиц

Примечание.

Рабочие области с обозревателем каталогов не имеют доступа к прежнему поведению, описанному ниже.

Щелкните значок каталога на боковой панели. Azure Databricks выберет работающий кластер, к которому у вас есть доступ. В папке "Базы данных" отображается список баз данных с выбранной базой данных default. В папке "Таблицы" отображается список таблиц в базе данных default.

Создание списка таблиц

Вы можете изменить кластер из меню "Базы данных", создать пользовательский интерфейс таблицыили просмотреть пользовательский интерфейс таблицы. Например, в меню Databases (Базы данных):

  1. Щелкните стрелку Down Caret вниз в верхней части папки "Базы данных".

  2. Выберите кластер.

    Выбор кластера

Просмотр сведений о таблице

В представлении сведений о таблице показаны схема таблицы и примеры данных.

  1. Щелкните значок каталога на боковой панели.

  2. В папке Databases (Базы данных) щелкните базу данных.

  3. В папке "Таблицы" щелкните имя таблицы.

  4. В раскрывающемся списке кластера при необходимости выберите другой кластер, чтобы отобразить предварительную версию таблицы.

    подробности таблицы

    Примечание.

    Чтобы отобразить предварительную версию таблицы, запрос SQL Spark выполняется в кластере, выбранном в раскрывающемся списке кластера . Если в кластере уже запущена рабочая нагрузка, предварительная версия таблицы может занять больше времени для загрузки.

Удаление таблицы с помощью пользовательского интерфейса

  1. Щелкните значок каталога на боковой панели.
  2. Щелкните меню выпадающего списка рядом с именем таблицы и выберите Удалить.