LIVE 스키마(레거시)
이 문서에서는 LIVE
가상 스키마에 대한 레거시 구문 및 동작에 대한 개요를 제공합니다.
LIVE
가상 스키마는 Delta Live Tables 파이프라인의 레거시 기능이며 더 이상 사용되지 않는 것으로 간주됩니다. 이 모드로 만든 파이프라인에는 레거시 게시 모드 및 LIVE
가상 스키마를 계속 사용할 수 있습니다. Databricks는 모든 파이프라인을 새 게시 모드로 마이그레이션하는 것이 좋습니다. 레거시 LIVE
가상 스키마 및 레거시 게시 모드에 대한 지원은 이후 버전의 Azure Databricks에서 제거됩니다.
메모
파이프라인 구성 UI를 사용하여 레거시 게시 모드로 새 파이프라인을 만들 수 없습니다. 레거시 LIVE
구문을 사용하여 새 파이프라인을 배포해야 하는 경우 Databricks 계정 담당자에게 문의하세요.
LIVE 가상 스키마란?
메모
LIVE
가상 스키마는 더 이상 Delta Live Tables의 기본 게시 모드에서 데이터 세트 종속성을 분석할 필요가 없습니다.
LIVE
스키마는 파이프라인에서 만들거나 업데이트된 모든 데이터 세트에 대한 가상 경계를 정의하는 Delta Live Tables의 프로그래밍 개념입니다. 기본적으로 LIVE
스키마는 게시된 스키마의 데이터 세트에 직접 연결되지 않습니다. 대신 LIVE
스키마를 사용하면 사용자가 스키마에 데이터 세트를 게시하지 않으려는 경우에도 파이프라인의 논리를 계획하고 실행할 수 있습니다.
레거시 파이프라인 게시 모드에서는 LIVE
키워드를 사용하여 현재 파이프라인의 다른 데이터 세트를 참조할 수 있습니다(예: SELECT * FROM LIVE.bronze_table
). 새 Delta Live Tables 파이프라인의 기본 게시 모드에서 이 구문은 자동으로 무시됩니다. 즉, 정규화되지 않은 식별자는 현재 스키마를 사용합니다.
대상 카탈로그 및 스키마 설정은을 참조하세요.
레거시 파이프라인 게시 모드
LIVE
가상 스키마는 레거시 Delta Live Tables 파이프라인 게시 모드와 함께 사용됩니다. 2025년 2월 5일 이전에 만든 모든 테이블은 기본적으로 레거시 게시 모드를 사용합니다.
다음 표에서는 레거시 게시 모드에서 파이프라인에서 만들거나 업데이트된 모든 구체화된 뷰 및 스트리밍 테이블에 대한 동작을 설명합니다.
스토리지 옵션 | 스토리지 위치 또는 카탈로그 | 대상 스키마 | 행동 |
---|---|---|---|
Hive 메타스토어 | 없음 지정됨 | 없음 지정됨 | 데이터 세트 메타데이터 및 데이터는 DBFS 루트에 저장됩니다. Hive 메타스토어에 등록된 데이터베이스 개체가 없습니다. |
Hive 메타스토어 | 클라우드 개체 스토리지에 대한 URI 또는 파일 경로입니다. | 없음 지정됨 | 데이터 세트 메타데이터 및 데이터는 지정된 스토리지 위치에 저장됩니다. Hive 메타스토어에 등록된 데이터베이스 개체가 없습니다. |
Hive 메타스토어 | 없음 지정됨 | Hive 메타스토어의 기존 스키마 또는 새 스키마입니다. | 데이터 세트 메타데이터 및 데이터는 DBFS 루트에 저장됩니다. 파이프라인의 구체화된 모든 뷰 및 스트리밍 테이블은 Hive 메타스토어의 지정된 스키마에 게시됩니다. |
Hive 메타스토어 | 클라우드 개체 스토리지에 대한 URI 또는 파일 경로입니다. | Hive 메타스토어의 기존 스키마 또는 새 스키마입니다. | 데이터 세트 메타데이터 및 데이터는 지정된 스토리지 위치에 저장됩니다. 파이프라인의 구체화된 모든 뷰 및 스트리밍 테이블은 Hive 메타스토어의 지정된 스키마에 게시됩니다. |
Unity 카탈로그 | 기존 Unity 카탈로그입니다. | 없음 지정됨 | 데이터 세트 메타데이터 및 데이터는 대상 카탈로그와 연결된 기본 스토리지 위치에 저장됩니다. Unity 카탈로그에 등록된 데이터베이스 개체가 없습니다. |
Unity 카탈로그 | 기존 Unity 카탈로그입니다. | Unity 카탈로그의 기존 스키마 또는 새 스키마입니다. | 데이터 세트 메타데이터 및 데이터는 대상 스키마 또는 카탈로그와 연결된 기본 스토리지 위치에 저장됩니다. 파이프라인의 모든 구체화된 뷰 및 스트리밍 테이블은 Unity 카탈로그의 지정된 스키마에 게시됩니다. |
게시 모드 간 전환
레거시 게시 모드에서 만든 파이프라인은 파이프라인에 대한 JSON 구성을 업데이트하여 새 기본 게시 모드로 옵트인할 수 있습니다. 필요한 경우 새 기본 동작을 사용하도록 설정한 후 파이프라인을 레거시 게시 모드로 되돌릴 수 있습니다.
재산 | 행동 |
---|---|
target |
레거시 게시 모드를 사용하도록 파이프라인을 구성합니다. 대상 스키마의 이름을 문자열로 지정합니다. |
schema |
여러 스키마에서 구체화된 뷰 및 스트리밍 테이블을 업데이트하도록 지원하는 기본 게시 모드를 사용하도록 파이프라인을 구성합니다. 기본 스키마의 이름을 문자열로 지정합니다. |
Delta Live Tables 속성 참조을 참조하세요.
메모
Unity 카탈로그 및 Hive 메타스토어 파이프라인에서 각각 사용되는 catalog
또는 storage
속성을 업데이트할 필요가 없습니다.
LIVE 스키마에서 소스 코드 업데이트
새 기본 게시 모드로 실행되도록 구성된 파이프라인은 LIVE
스키마 구문을 자동으로 무시합니다. 기본적으로 모든 테이블 읽기는 파이프라인 구성에 지정된 카탈로그 및 스키마를 사용합니다.
대부분의 기존 파이프라인의 경우 레거시 LIVE
가상 스키마 동작이 파이프라인 구성에 지정된 카탈로그 및 스키마로 읽기를 전달하므로 이 동작 변경은 영향을 주지 않습니다.
중요하다
작업 영역 기본 카탈로그 및 스키마를 활용하는 읽기가 있는 레거시 코드에는 코드 업데이트가 필요합니다. 구체화된 뷰 정의는 다음과 같습니다.
CREATE MATERIALIZED VIEW silver_table
AS SELECT * FROM raw_data
레거시 게시 모드에서 raw_data
테이블에서 정규화되지 않은 읽기는 작업 영역 기본 카탈로그 및 스키마(예: main.default.raw_data
)를 사용합니다. 새 기본 파이프라인 모드에서 기본적으로 사용되는 카탈로그 및 스키마는 파이프라인 구성에 구성된 것입니다. 이 코드가 예상대로 계속 작동하도록 하려면 다음 예제와 같이 테이블에 대한 정규화된 식별자를 사용하도록 참조를 업데이트합니다.
CREATE MATERIALIZED VIEW silver_table
AS SELECT * FROM main.default.raw_data