Работа с управляемыми таблицами
Azure Databricks управляет жизненным циклом и макетом файлов для управляемой таблицы. Управляемые таблицы — это способ создания таблиц по умолчанию.
Databricks рекомендует использовать управляемые таблицы для всех табличных данных, управляемых в Azure Databricks.
Примечание.
В этой статье рассматриваются управляемые таблицы каталога Unity. Управляемые таблицы в устаревшем хранилище метаданных Hive отличаются поведению. См . статью "Объекты базы данных" в устаревшем хранилище метаданных Hive.
Работа с управляемыми таблицами
Вы можете работать с управляемыми таблицами на всех языках и продуктах, поддерживаемых в Azure Databricks. Для создания, обновления, удаления или запроса управляемых таблиц требуются определенные привилегии. См. статью Управление привилегиями в каталоге Unity.
Не следует использовать средства за пределами Azure Databricks для управления файлами в управляемых таблицах напрямую.
Вы должны взаимодействовать только с файлами данных в управляемой таблице с помощью имени таблицы.
Файлы данных для управляемых таблиц хранятся в расположении управляемого хранилища, связанном с содержащей схемой. См. раздел "Указание расположения управляемого хранилища" в каталоге Unity.
Создание управляемой таблицы
По умолчанию при создании таблицы с помощью команд SQL, Spark или других средств в Azure Databricks таблица управляется.
В следующем синтаксисе SQL показано, как создать пустую управляемую таблицу с помощью SQL. Замените значения-заполнители:
-
<catalog-name>
: имя каталога, который будет содержать таблицу. -
<schema-name>
: имя схемы, которая будет содержать таблицу. -
<table-name>
: имя таблицы. -
<column-specification>
: имя и тип данных для каждого столбца.
CREATE TABLE <catalog-name>.<schema-name>.<table-name>
(
<column-specification>
);
Многие пользователи создают управляемые таблицы из результатов запроса или операций записи dataFrame. В следующих статьях демонстрируется несколько шаблонов, которые можно использовать для создания управляемой таблицы в Azure Databricks:
Необходимые разрешения
Чтобы создать управляемую таблицу, необходимо:
- Разрешение
USE SCHEMA
для родительской схемы таблицы. - Разрешение
USE CATALOG
родительского каталога таблицы. - Разрешение
CREATE TABLE
для родительской схемы таблицы.
Удаление управляемой таблицы
Вы должны быть владельцем таблицы или иметь права MANAGE
для таблицы, чтобы удалить таблицу. Чтобы удалить управляемую таблицу, выполните следующую команду SQL:
DROP TABLE IF EXISTS catalog_name.schema_name.table_name;
При удалении управляемой таблицы ее базовые данные удаляются из облачного клиента в течение 30 дней.