Azure Synapse Analytics에서 Delta Lake 사용

중급
데이터 엔지니어
Azure Synapse Analytics

Delta Lake는 Azure Synapse Analytics에서 데이터 레이크하우스 아키텍처를 구현하는 데 사용할 수 있는 Spark용 오픈 소스 관계형 스토리지 영역입니다.

학습 목표

이 모듈에서는 다음을 수행하는 방법을 알아봅니다.

  • Delta Lake의 주요 특징 및 기능에 대해 설명합니다.
  • Synapse Analytics Spark 풀에서 Delta Lake 테이블을 만들고 사용합니다.
  • Delta Lake 데이터에 대한 Spark 카탈로그 테이블을 만듭니다.
  • 스트리밍 데이터에 Delta Lake 테이블을 사용합니다.
  • Synapse Analytics SQL 풀에서 Delta Lake 테이블을 쿼리합니다.

사전 요구 사항

이 모듈을 최대한 활용하려면 Azure Synapse Analytics에서 Spark 풀 작업을 수행한 기존 지식이 필요합니다. 먼저 Azure Synapse Analytics에서 Apache Spark를 사용하여 데이터 분석 모듈을 완료하는 것이 좋습니다.