klauzule CLUSTER BY
(TABLE)
Platí pro: Databricks SQL Databricks Runtime 13.3 LTS a vyšší pouze Delta Lake
Definuje kapalné, multidimenzionální clustering pro tabulku Delta Lake.
Tuto klauzuli můžete použít v těchto případech:
- Vytvoření tabulky pomocí CREATE TABLE
- Upravte tabulku s ALTER TABLE tak, aby změnila sloupce pro seskupování. Pokud chcete seskupit řádky se změněnými sloupci clusteringu, musíte spustit OPTIMIZE. Všimněte si, že řádky seskupené podle předchozích seskupovacích sloupců nejsou ovlivněny.
Aktualizované řádky se automaticky znovu neseskupí. Spuštěním OPTIMIZE znovu seskupte aktualizované řádky.
Další informace o clusteringu liquid naleznete v tématu Použití clusteringu liquid pro tabulky Delta
Syntaxe
CLUSTER BY { ( column_name [, ...] ] ) |
NONE }
Parametry
-
Určuje sloupce tabulky, podle kterých se mají data seskupit. Pořadí sloupců nezáleží. Pokud chcete využít výhod změny clusteringu, měli byste spustit OPTIMIZE.
ŽÁDNÝ
Vypne clustering pro změněnou tabulku. Nově vložená nebo aktualizovaná data nebudou seskupena OPTIMIZE. Pokud nechcete při vytváření tabulky používat clustering, vymešte klauzuli
CLUSTER BY
.
Příklady
Další příklady najdete v Použití tekutého clusteringu pro tabulky Delta.
-- Create a table with a clustering column
> CREATE TABLE t(a int, b string) CLUSTER BY (a);
-- The clustering of an existing Delta table to add a second dimension
> ALTER TABLE t CLUSTER BY (a, b);
-- Recluster the table
> OPTIMIZE t;
-- Remove the clustering
> ALTER TABLE t CLUSTER BY NONE;