CLUSTER BY
cláusula (TABLE)
Aplica-se a:Databricks SQL
Databricks Runtime 13.3 LTS e acima
Delta Lake apenas
Define o agrupamento líquido e multidimensional para uma tabela Delta Lake.
Pode utilizar esta cláusula quando:
- Criar uma tabela usando CREATE TABLE
- Altere uma tabela com ALTER TABLE para modificar as colunas de agrupamento. Para agrupar linhas com colunas de clustering alteradas, você deve executar OPTIMIZE. Observe que as linhas agrupadas por colunas de agrupamento anteriores não são afetadas.
As linhas atualizadas não são automaticamente reagrupadas. Execute OPTIMIZE para reagrupar linhas atualizadas..
Para obter mais informações sobre clustering líquido, consulte Usar clustering líquido para tabelas Delta
Sintaxe
CLUSTER BY { ( column_name [, ...] ] ) |
NONE }
Parâmetros
-
Especifica colunas da tabela pelas quais agrupar os dados. A ordem das colunas não importa. Para se beneficiar da alteração do clustering, você deve executar OPTIMIZE.
NENHUM
Desativa o agrupamento para a tabela que está sendo alterada. Os dados recém-inseridos ou atualizados não serão agrupados por OPTIMIZE. Para não usar clustering ao criar uma tabela, omita a
CLUSTER BY
cláusula.
Exemplos
Você pode encontrar mais exemplos em Usar agrupamento líquido para tabelas Delta.
-- Create a table with a clustering column
> CREATE TABLE t(a int, b string) CLUSTER BY (a);
-- The clustering of an existing Delta table to add a second dimension
> ALTER TABLE t CLUSTER BY (a, b);
-- Recluster the table
> OPTIMIZE t;
-- Remove the clustering
> ALTER TABLE t CLUSTER BY NONE;