CLUSTER BY
component (TABLE)
Van toepassing op: Alleen Databricks SQL Databricks Runtime 13.3 LTS en hoger
Definieert vloeibare, multidimensionale clustering voor een Delta Lake-tabel.
U kunt deze component gebruiken wanneer u:
- Een tabel maken met CREATE TABLE
- Wijzig een tabel met ALTER TABLE om de clusterkolommen te wijzigen. Als u rijen wilt clusteren met gewijzigde clusterkolommen, moet u OPTIMIZE uitvoeren. Houd er rekening mee dat rijen die zijn geclusterd door eerdere clusterkolommen, niet worden beïnvloed.
Bijgewerkte rijen worden niet automatisch opnieuw geclusterd. Voer OPTIMIZE uit om bijgewerkte rijen opnieuw te clusteren.
Zie Liquid Clustering gebruiken voor Delta-tabellen voor meer informatie over liquide clustering
Syntaxis
CLUSTER BY { ( column_name [, ...] ] ) |
NONE }
Parameters
-
Hiermee geeft u kolommen van de tabel op waarmee de gegevens moeten worden geclusterd. De kolomvolgorde maakt niet uit. Als u wilt profiteren van het wijzigen van clustering, moet u OPTIMIZE uitvoeren.
GEEN
Hiermee schakelt u clustering uit voor de tabel die wordt gewijzigd. Nieuw ingevoegde of bijgewerkte gegevens worden niet geclusterd door OPTIMIZE. Als u clustering niet wilt gebruiken bij het maken van een tabel, laat u de
CLUSTER BY
component weg.
Voorbeelden
Meer voorbeelden vindt u in Liquid Clustering gebruiken voor Delta-tabellen.
-- Create a table with a clustering column
> CREATE TABLE t(a int, b string) CLUSTER BY (a);
-- The clustering of an existing Delta table to add a second dimension
> ALTER TABLE t CLUSTER BY (a, b);
-- Recluster the table
> OPTIMIZE t;
-- Remove the clustering
> ALTER TABLE t CLUSTER BY NONE;