Azure Synapse Analytics에서 Delta Lake 사용
Delta Lake는 Azure Synapse Analytics에서 데이터 레이크하우스 아키텍처를 구현하는 데 사용할 수 있는 Spark용 오픈 소스 관계형 스토리지 영역입니다.
학습 목표
이 모듈에서는 다음을 수행하는 방법을 알아봅니다.
- Delta Lake의 주요 특징 및 기능에 대해 설명합니다.
- Synapse Analytics Spark 풀에서 Delta Lake 테이블을 만들고 사용합니다.
- Delta Lake 데이터에 대한 Spark 카탈로그 테이블을 만듭니다.
- 스트리밍 데이터에 Delta Lake 테이블을 사용합니다.
- Synapse Analytics SQL 풀에서 Delta Lake 테이블을 쿼리합니다.
사전 요구 사항
이 모듈을 최대한 활용하려면 Azure Synapse Analytics에서 Spark 풀 작업을 수행한 기존 지식이 필요합니다. 먼저 Azure Synapse Analytics에서 Apache Spark를 사용하여 데이터 분석 모듈을 완료하는 것이 좋습니다.