Поделиться через


ALTER TABLE

Область применения:отмечено как Databricks SQL отмечено как Databricks Runtime

Изменяет схему или свойства таблицы.

Сведения о том, как изменять типы или имена столбцов в Delta Lake см. в статье Перезапись данных.

Чтобы изменить комментарий к таблице или столбцу, можно также использовать COMMENT ON.

Чтобы изменить STREAMING TABLE, используйте ALTER STREAMING TABLE.

Если таблица кэшируется, команда очищает кэшированные данные таблицы и все зависимые от нее параметры. Кэш будет медленно заполняться при следующем обращении к таблице или зависимостям.

Примечание.

При добавлении столбца в существующую таблицу Delta нельзя определить значение DEFAULT. Все столбцы, добавленные в таблицы Delta, обрабатываются как NULL для существующих строк. После добавления столбца можно при необходимости определить значение по умолчанию для столбца, но оно применяется только для новых строк, вставленных в таблицу. Используйте следующий синтаксис:

ALTER TABLE table_name ALTER COLUMN column_name SET DEFAULT default_expression

В внешних таблицах можно выполнять только ALTER TABLE SET OWNER и ALTER TABLE RENAME TO.

Необходимые разрешения

Если вы используете каталог Unity, вам необходимо разрешение MODIFY на выполнение следующих действий:

  • ИЗМЕНИТЬ COLUMN
  • ДОБАВИТЬ COLUMN
  • УДАЛИТЬ COLUMN
  • SET TBLPROPERTIES
  • ОТМЕНИТЬ СВОЙСТВА ТАБЛИЦЫ
  • модификация ПРОГНОЗНОЙ ОПТИМИЗАЦИИ

Если вы используете каталог Unity, вы должны обладать разрешением или правом владения MANAGE:

  • SET ВЛАДЕЛЕЦ

Для всех остальных операций необходимо быть владельцем таблицы.

Синтаксис

ALTER TABLE table_name
    { RENAME TO clause |
      ADD COLUMN clause |
      ALTER COLUMN clause |
      DROP COLUMN clause |
      RENAME COLUMN clause |
      DEFAULT COLLATION clause |
      ADD CONSTRAINT clause |
      DROP CONSTRAINT clause |
      DROP FEATURE clause |
      ADD PARTITION clause |
      DROP PARTITION clause |
      PARTITION SET LOCATION clause |
      RENAME PARTITION clause |
      RECOVER PARTITIONS clause |
      SET { ROW FILTER clause } |
      DROP ROW FILTER |
      SET TBLPROPERTIES clause |
      UNSET TBLPROPERTIES clause |
      SET SERDE clause |
      SET LOCATION clause |
      SET OWNER TO clause |
      SET SERDE clause |
      SET TAGS clause |
      UNSET TAGS clause |
      CLUSTER BY clause |
      PREDICTIVE OPTIMIZATION clause}

Параметры

  • ALTER COLUMN

    Изменяет свойство или расположение столбца.

  • УДАЛИТЬ COLUMN

    Удалите один или несколько столбцов или полей в таблице Delta Lake.

  • ПЕРЕИМЕНОВАТЬ COLUMN

    Переименовывает столбец или поле в таблице Delta Lake.

  • ADD CONSTRAINT

    Добавляет в таблицу ограничение проверки, информационное ограничение внешнего ключа или информационное ограничение первичного ключа.

    Внешние ключи и первичные ключи поддерживаются только для таблиц в каталоге Unity, а не в каталоге hive_metastore.

  • DEFAULT COLLATION collation_name

    применяется:отмечен галочкой 'Да' Databricks Runtime 16.3 и выше

    Изменяет параметры сортировки таблицы по умолчанию для новых столбцов STRING. Данный пункт не затрагивает существующие столбцы. Чтобы изменить параметры сортировки существующего столбца, используйте ALTER TABLE ... ALTER COLUMN ... COLLATE collation_name.

  • DROP CONSTRAINT

    Удаляет из таблицы ограничение первичного ключа, внешнего ключа или проверочное ограничение.

  • DROP FEATURE feature_name [ TRUNCATE HISTORY ]

    Область применения:отмечено Databricks SQL отмечено Databricks Runtime 14.1 и выше

    Удаляет функцию из таблицы Delta Lake.

    Удаление функций, влияющих как на читателей, так и на писателей, требует двухэтапного процесса.

    Дополнительные сведения см. в разделе "Что такое функции таблицы".

    • feature_name

      Имя функции в виде STRING литерала или идентификатора, которое должно пониматься Azure Databricks и поддерживаться в таблице.

      Поддерживаются feature_names :

      • "deletionVectors" или deletionvectors
        • 'v2Checkpoint' или v2checkpoint

      Если функция отсутствует в таблице, Azure Databricks генерирует DELTA_FEATURE_DROP_FEATURE_NOT_PRESENT.

    • УСЕЧЕНИЕ ИСТОРИИ

      При необходимости можно инициировать второй этап отключения функции чтения и записи через 24 часа, усечив историю таблиц до момента выполнения команды вызова.

      Усечение истории таблицы ограничивает вашу возможность выполнять DESCRIBE HISTORY и выполнять запросы с функцией путешествия во времени.

  • ADD PARTITION

    Добавляет в таблицу один или несколько разделов.

  • DROP PARTITION

    Удаляет один или несколько разделов из таблицы.

  • PARTITION ... SET ЛОКАЦИЯ

    Задает расположение раздела.

  • ПЕРЕИМЕНОВАТЬ PARTITION

    Заменяет ключи раздела.

  • ВОССТАНОВЛЕНИЕ РАЗДЕЛОВ

    Указывает Azure Databricks сканировать расположение таблицы и добавлять все файлы в таблицу, которые были добавлены непосредственно в файловую систему.

  • пункт SETROW FILTER

    Применимо к:отмечено «Да» Databricks SQL отмечено «Да» Databricks Runtime 12.2 LTS и более поздних версий отмечено «Да» Unity Catalog

    Добавляет функцию фильтра строк в таблицу. Все последующие запросы к таблице получают подмножество строк, для которых функция возвращает логическое значение TRUE. Это может быть полезно для точного контроля доступа, где функция может проверить удостоверение или членство в группах вызывающего пользователя, чтобы определить, следует ли фильтровать определенные строки.

  • DROP ROW FILTER

    Применимо к:отмечен флажок только для Unity Catalog

    Удаляет фильтр строк из таблицы, если таковой есть. Будущие запросы возвращают все строки из таблицы без автоматической фильтрации.

  • SET TBLPROPERTIES

    Задает или сбрасывает одно или несколько свойств, определяемых пользователем.

  • UNSET TBLPROPERTIES

    Удаляет одно или несколько свойств, определяемых пользователем.

  • SET LOCATION

    Перемещает расположение таблицы.

    SET LOCATION path
    
    • LOCATION path

      path должен быть литеральным значением STRING. Указывает новое расположение таблицы.

      Файлы в исходном расположении не будут перемещаться в новое расположение.

  • [ SET ] OWNER TO директор

    Передает права владения таблицей объекту principal.

    Область применения:флажок Databricks SQL флажок Databricks Runtime 11.3 LTS и выше

    SET разрешено в качестве необязательного ключевого слова.

  • SET TAGS ( { tag_name = tag_value } [, ...] )

    Область применения:флажок Databricks SQL флажок Databricks Runtime 13.3 LTS и выше

    Примените теги к таблице. Необходимо иметь APPLY TAG разрешение на добавление тегов в таблицу.

    • tag_name

      Литерал STRING. tag_name должен быть уникальным внутри таблицы или столбца.

    • tag_value

      Литерал STRING.

  • UNSET TAGS ( tag_name [, ...] )

    Область применения:флажок Databricks SQL флажок Databricks Runtime 13.3 LTS и выше

    Удалите теги из таблицы. Необходимо иметь APPLY TAG разрешение на удаление тегов из таблицы.

    • tag_name

      Литерал STRING. tag_name должен быть уникальным внутри таблицы или столбца.

  • положение CLUSTER BY

    Область применения:флажок Databricks SQL флажок Databricks Runtime 13.3 LTS и выше

    Добавляет, изменяет или удаляет стратегию кластеризации для таблицы Delta Lake.

  • { ENABLE | DISABLE | INHERIT } PREDICTIVE OPTIMIZATION

    Применимо к:отмечено «Да» Databricks SQL отмечено «Да» Databricks Runtime 12.2 LTS и более поздних версий отмечено «Да» Unity Catalog

    Изменяет управляемую таблицу Delta Lake на нужный параметр прогнозной оптимизации.

    По умолчанию при создании таблиц действует INHERIT из схемы.

    Если прогнозная оптимизация явно включена или унаследована как активированная, OPTIMIZE и VACUUM будут автоматически вызываться в таблице, если это будет сочтено подходящим в Azure Databricks. Дополнительные сведения см. в разделе прогнозной оптимизации управляемых таблиц каталога Unity.

Примеры

См. раздел о добавлении ограничений и изменении столбцов в Delta Lake для примеров.

-- RENAME table
> DESCRIBE student;
                col_name data_type comment
 ----------------------- --------- -------
                    name    string    NULL
                  rollno       int    NULL
                     age       int    NULL
 # Partition Information
              # col_name data_type comment
                     age       int    NULL

> ALTER TABLE Student RENAME TO StudentInfo;

-- After Renaming the table
> DESCRIBE StudentInfo;
                col_name data_type comment
 ----------------------- --------- -------
                    name    string    NULL
                  rollno       int    NULL
                     age       int    NULL
 # Partition Information
              # col_name data_type comment
                     age       int    NULL

-- RENAME partition
> SHOW PARTITIONS StudentInfo;
 partition
 ---------
    age=10
    age=11
    age=12

> ALTER TABLE default.StudentInfo PARTITION (age='10') RENAME TO PARTITION (age='15');

-- After renaming Partition
> SHOW PARTITIONS StudentInfo;
 partition
 ---------
    age=11
    age=12
    age=15

-- Add new columns to a table
> DESCRIBE StudentInfo;
                col_name data_type comment
 ----------------------- --------- -------
                    name    string    NULL
                  rollno       int    NULL
                     age       int    NULL
 # Partition Information
              # col_name data_type comment
                     age       int    NULL

> ALTER TABLE StudentInfo ADD columns (LastName string, DOB timestamp);

-- After Adding New columns to the table
> DESCRIBE StudentInfo;
                col_name data_type comment
 ----------------------- --------- -------
                    name    string    NULL
                  rollno       int    NULL
                LastName    string    NULL
                     DOB timestamp    NULL
                     age       int    NULL
 # Partition Information
              # col_name data_type comment
                     age       int    NULL

-- Add a new partition to a table
> SHOW PARTITIONS StudentInfo;
 partition
 ---------
    age=11
    age=12
    age=15

> ALTER TABLE StudentInfo ADD IF NOT EXISTS PARTITION (age=18);

-- After adding a new partition to the table
> SHOW PARTITIONS StudentInfo;
 partition
 ---------
    age=11
    age=12
    age=15
    age=18

-- Drop a partition from the table
> SHOW PARTITIONS StudentInfo;
 partition
 ---------
    age=11
    age=12
    age=15
    age=18

> ALTER TABLE StudentInfo DROP IF EXISTS PARTITION (age=18);

-- After dropping the partition of the table
> SHOW PARTITIONS StudentInfo;
 partition
 ---------
    age=11
    age=12
    age=15

-- Adding multiple partitions to the table
> SHOW PARTITIONS StudentInfo;
 partition
 ---------
    age=11
    age=12
    age=15

> ALTER TABLE StudentInfo ADD IF NOT EXISTS PARTITION (age=18) PARTITION (age=20);

-- After adding multiple partitions to the table
> SHOW PARTITIONS StudentInfo;
 partition
 ---------
    age=11
    age=12
    age=15
    age=18
    age=20

-- ALTER or CHANGE COLUMNS
> DESCRIBE StudentInfo;
                col_name data_type comment
+-----------------------+---------+-------
                    name    string    NULL
                  rollno       int    NULL
                LastName    string    NULL
                     DOB timestamp    NULL
                     age       int    NULL
 # Partition Information
              # col_name data_type comment
                     age       int    NULL

ALTER TABLE StudentInfo ALTER COLUMN name COMMENT "new comment";

--After ALTER or CHANGE COLUMNS
> DESCRIBE StudentInfo;
                col_name data_type     comment
 ----------------------- --------- -----------
                    name    string new comment
                  rollno       int        NULL
                LastName    string        NULL
                     DOB timestamp        NULL
                     age       int        NULL
 # Partition Information
              # col_name data_type     comment
                     age       int        NULL

-- RENAME COLUMN
> ALTER TABLE StudentInfo RENAME COLUMN name TO FirstName;

--After RENAME COLUMN
> DESCRIBE StudentInfo;
                col_name data_type     comment
 ----------------------- --------- -----------
               FirstName    string new comment
                  rollno       int        NULL
                LastName    string        NULL
                     DOB timestamp        NULL
                     age       int        NULL
 # Partition Information
              # col_name data_type     comment
                     age       int        NULL

-- Change the file Location
> ALTER TABLE dbx.tab1 PARTITION (a='1', b='2') SET LOCATION '/path/to/part/ways';

-- SET SERDE/ SERDE Properties (DBR only)
> ALTER TABLE test_tab SET SERDE 'org.apache.hadoop.hive.serde2.columnar.LazyBinaryColumnarSerDe';

> ALTER TABLE dbx.tab1 SET SERDE 'org.apache.hadoop' WITH SERDEPROPERTIES ('k' = 'v', 'kay' = 'vee');

-- SET TABLE PROPERTIES
> ALTER TABLE dbx.tab1 SET TBLPROPERTIES ('winner' = 'loser');

-- DROP TABLE PROPERTIES
> ALTER TABLE dbx.tab1 UNSET TBLPROPERTIES ('winner');

-- Drop the "deletion vectors" from a Delta table
> ALTER TABLE my_table DROP FEATURE deletionVectors;

-- 24 hours later
> ALTER TABLE my_table DROP FEATURE deletionVectors TRUNCATE HISTORY;

-- Applies three tags to the table named `test`.
> ALTER TABLE test SET TAGS ('tag1' = 'val1', 'tag2' = 'val2', 'tag3' = 'val3');

-- Removes three tags from the table named `test`.
> ALTER TABLE test UNSET TAGS ('tag1', 'tag2', 'tag3');

-- Applies three tags to table `main.schema1.test` column `col1`.
> ALTER TABLE main.schema1.test ALTER COLUMN col1 SET TAGS ('tag1' = 'val1', 'tag2' = 'val2', 'tag3' = 'val3');

-- Removes three tags from table `main.schema1.test` column `col1`.
> ALTER TABLE main.schema1.test ALTER COLUMN col1 UNSET TAGS ('tag1', 'tag2', 'tag3');
-- Enables predictive optimization for my_table
> ALTER TABLE my_table ENABLE PREDICTIVE OPTIMIZATION;