CLUSTER BY
절(TABLE)
적용 대상:Databricks SQL
Databricks Runtime 13.3 LTS 이상
Delta Lake만 해당
Delta Lake 테이블에 대한 액체 다차원 클러스터링을 정의합니다.
다음과 같은 경우 이 절을 사용할 수 있습니다.
- CREATE TABLE 사용하여 테이블 만들기
- ALTER TABLE 사용하여 테이블을 변경하여 클러스터링 열을 변경합니다. 변경된 클러스터링 열이 있는 행을 클러스터링하려면 OPTIMIZE실행해야 합니다. 이전 클러스터링 열에 의해 클러스터된 행은 영향을 받지 않습니다.
업데이트된 행은 자동으로 다시 클러스터되지 않습니다. OPTIMIZE 실행하여 업데이트된 행을 다시 클러스터합니다.
액체 클러스터링에 대한 자세한 내용은 델타 테이블에 액체 클러스터링 사용 참조하세요.
구문
CLUSTER BY { ( column_name [, ...] ] ) |
NONE }
매개 변수
-
데이터를 클러스터할 테이블의 열을 지정합니다. 열 순서는 중요하지 않습니다. 클러스터링 변경을 활용하려면 OPTIMIZE실행해야 합니다.
없음
변경 중인 테이블에 대한 클러스터링을 해제합니다. 새로 삽입되거나 업데이트된 데이터는 OPTIMIZE에 의해 클러스터링되지 않습니다. 테이블을 만들 때 클러스터링을 사용하지 않려면
CLUSTER BY
절을 생략합니다.
예제
델타 테이블액체 클러스터링 사용에서 더 많은 예제를 찾을 수 있습니다.
-- Create a table with a clustering column
> CREATE TABLE t(a int, b string) CLUSTER BY (a);
-- The clustering of an existing Delta table to add a second dimension
> ALTER TABLE t CLUSTER BY (a, b);
-- Recluster the table
> OPTIMIZE t;
-- Remove the clustering
> ALTER TABLE t CLUSTER BY NONE;