Delen via


CLUSTER BY component (TABLE)

Van toepassing op:vinkje als ja aan Alleen Databricks SQL vinkje als ja aan Databricks Runtime 13.3 LTS en hoger vinkje als ja aan

Definieert vloeibare, multidimensionale clustering voor een Delta Lake-tabel.

U kunt deze component gebruiken wanneer u:

  • Een tabel maken met CREATE TABLE
  • Wijzig een tabel met ALTER TABLE om de clusterkolommen te wijzigen. Als u rijen wilt clusteren met gewijzigde clusterkolommen, moet u OPTIMIZE uitvoeren. Houd er rekening mee dat rijen die zijn geclusterd door eerdere clusterkolommen, niet worden beïnvloed.

Bijgewerkte rijen worden niet automatisch opnieuw geclusterd. Voer OPTIMIZE uit om bijgewerkte rijen opnieuw te clusteren.

Zie Liquid Clustering gebruiken voor Delta-tabellen voor meer informatie over liquide clustering

Syntaxis

CLUSTER BY { ( column_name [, ...] ] ) |
             NONE }

Parameters

  • column_name

    Hiermee geeft u kolommen van de tabel op waarmee de gegevens moeten worden geclusterd. De kolomvolgorde maakt niet uit. Als u wilt profiteren van het wijzigen van clustering, moet u OPTIMIZE uitvoeren.

  • GEEN

    Hiermee schakelt u clustering uit voor de tabel die wordt gewijzigd. Nieuw ingevoegde of bijgewerkte gegevens worden niet geclusterd door OPTIMIZE. Als u clustering niet wilt gebruiken bij het maken van een tabel, laat u de CLUSTER BY component weg.

Voorbeelden

Meer voorbeelden vindt u in Liquid Clustering gebruiken voor Delta-tabellen.

-- Create a table with a clustering column
> CREATE TABLE t(a int, b string) CLUSTER BY (a);

-- The clustering of an existing Delta table to add a second dimension
> ALTER TABLE t CLUSTER BY (a, b);

-- Recluster the table
> OPTIMIZE t;

-- Remove the clustering
> ALTER TABLE t CLUSTER BY NONE;