다음을 통해 공유


CLUSTER BY 절(TABLE)

적용 대상:예로 표시된 확인Databricks SQL 예로 표시된 확인 Databricks Runtime 13.3 LTS 이상 예로 표시된 확인 Delta Lake만 해당

Delta Lake table에 대한 유동적 다차원 클러스터링을 정의합니다.

다음과 같은 경우 이 절을 사용할 수 있습니다.

  • CREATE TABLE 사용하여 table 만들기
  • table를 ALTER TABLE으로 변경하여 클러스터링 columns를 수정합니다. 변경된 클러스터링 columns있는 행을 클러스터하려면 OPTIMIZE실행해야 합니다. 이전의 클러스터링 columns으로 클러스터링된 행은 영향을 받지 않습니다.

업데이트된 행은 자동으로 다시 클러스터되지 않습니다 get. OPTIMIZE 실행하여 업데이트된 행을 다시 클러스터합니다.

액체 클러스터링에 대한 더 많은 정보는 Delta에 액체 클러스터링을 사용하는 방법을 참조하세요 tables.

구문

CLUSTER BY { ( column_name [, ...] ] ) |
             NONE }

Parameters

  • column_name

    table을 (를) 기준으로 데이터를 클러스터링하는 columns을 (를) 지정합니다. column 순서는 중요하지 않습니다. 클러스터링 변경을 활용하려면 OPTIMIZE실행해야 합니다.

  • 없음

    table을(를) 변경하는 동안 클러스터링을 해제합니다. 새로 삽입되거나 업데이트된 데이터는 OPTIMIZE에 의해 클러스터링되지 않습니다. table만들 때 클러스터링을 사용하지 않려면 CLUSTER BY 절을 생략합니다.

예제

델타 에서 액체 클러스터링 사용 예제를 tables에서 더 많이 찾을 수 있습니다.

-- Create a table with a clustering column
> CREATE TABLE t(a int, b string) CLUSTER BY (a);

-- The clustering of an existing Delta table to add a second dimension
> ALTER TABLE t CLUSTER BY (a, b);

-- Recluster the table
> OPTIMIZE t;

-- Remove the clustering
> ALTER TABLE t CLUSTER BY NONE;