Azure Synapse Apache Spark 풀을 사용하여 데이터 엔지니어링 수행

중급
데이터 엔지니어
Azure Synapse Analytics

Apache Spark는 빅 데이터 분석 및 변환을 위한 확장성이 뛰어난 분산 처리 솔루션입니다. Spark 풀을 사용하여 Azure Synapse Analytics에서 강력한 기능을 활용할 수 있습니다.

사전 요구 사항

이 학습 경로를 시작하려면 먼저 Azure Synapse Analytics에 대해 잘 알고 있어야 합니다. 먼저 Azure Synapse 분석 소개 모듈을 완료하는 것이 좋습니다.

이 학습 경로의 모듈

Apache Spark는 대규모 데이터 분석을 위한 핵심 기술입니다. Azure Synapse Analytics에서 Spark를 사용하여 데이터 레이크의 데이터를 분석하고 시각화하는 방법을 알아봅니다.

데이터 엔지니어는 일반적으로 대량의 데이터를 변환해야 합니다. Azure Synapse Analytics의 Apache Spark 풀은 이 목표를 달성하는 데 사용할 수 있는 분산 처리 플랫폼을 제공합니다.

Delta Lake는 Azure Synapse Analytics에서 데이터 레이크하우스 아키텍처를 구현하는 데 사용할 수 있는 Spark용 오픈 소스 관계형 스토리지 영역입니다.