Поделиться через


Работа с управляемыми таблицами

Azure Databricks управляет жизненным циклом и макетом файлов для управляемой таблицы. Управляемые таблицы — это способ создания таблиц по умолчанию.

Databricks рекомендует использовать управляемые таблицы для всех табличных данных, управляемых в Azure Databricks.

Примечание.

В этой статье рассматриваются управляемые таблицы каталога Unity. Управляемые таблицы в устаревшем хранилище метаданных Hive отличаются по поведению. См . статью "Объекты базы данных" в устаревшем хранилище метаданных Hive.

Работа с управляемыми таблицами

Вы можете работать с управляемыми таблицами на всех языках и продуктах, поддерживаемых в Azure Databricks. Для создания, обновления, удаления или запроса управляемых таблиц требуются определенные привилегии. См. в каталоге Unity раздел Управление привилегиями.

Не следует использовать средства за пределами Azure Databricks для управления файлами в управляемых таблицах напрямую.

Вы должны взаимодействовать только с файлами данных в управляемой таблице с помощью имени таблицы.

Файлы данных для управляемых таблиц хранятся в расположении управляемого хранилища, связанном с содержащей схемой. См. Укажите управляемое расположение хранилища в каталоге Unity.

Создание управляемой таблицы

По умолчанию при создании таблицы с помощью команд SQL, Spark или других средств в Azure Databricks таблица управляется.

В следующем синтаксисе SQL показано, как создать пустую управляемую таблицу с помощью SQL. Замените значения заполнителей:

  • <catalog-name>: имя каталога, содержащего таблицу.
  • <schema-name>: имя схемы, содержащей таблицу.
  • <table-name>: это имя для таблицы.
  • <column-specification>: имя и тип данных для каждого столбца.
CREATE TABLE <catalog-name>.<schema-name>.<table-name>
(
  <column-specification>
);

Многие пользователи создают управляемые таблицы из результатов запроса или операций записи DataFrame. В следующих статьях демонстрируется несколько шаблонов, которые можно использовать для создания управляемой таблицы в Azure Databricks:

Необходимые разрешения

Чтобы создать управляемую таблицу, необходимо:

  • Разрешение USE SCHEMA родительской схемы таблицы.
  • Разрешение USE CATALOG для родительского каталога таблицы.
  • Разрешение CREATE TABLE для родительской схемы таблицы.

Удалите управляемую таблицу

Вы должны быть владельцем таблицы или иметь права MANAGE для таблицы, чтобы удалить таблицу. Чтобы удалить управляемую таблицу, выполните следующую команду SQL:

DROP TABLE IF EXISTS catalog_name.schema_name.table_name;

При удалении управляемой таблицы базовые данные удаляются из вашего облачного клиента в течение 30 дней.