Azure Data Lake Storage Gen2 살펴보기

완료됨

Azure Data Lake Store(Gen1)는 분석 데이터 레이크용 계층적 데이터 스토리지를 위한 별도의 서비스로, 파일에 저장된 정형, 반정형 및 비정형 데이터를 사용하는 소위 빅 데이터 분석 솔루션에서 자주 사용됩니다. Azure Data Lake Storage Gen2는 Azure Storage에 통합된 이 서비스의 최신 버전입니다. 이를 통해 계층적 파일 시스템 기능 및 Azure Data Lake Store의 주요 분석 시스템과의 호환성과 결합된 Blob 스토리지의 확장성과 스토리지 계층의 비용 제어를 활용할 수 있습니다.

계층 구조 네임스페이스가 있는 Azure Blob Storage 컨테이너 스크린샷

Azure Databricks와 같은 시스템은 Azure Data Lake Store Gen2에서 호스트되는 분산 파일 시스템을 탑재하고 이를 사용하여 방대한 양의 데이터를 처리할 수 있습니다. Microsoft Fabric 테넌트는 Azure Data Lake Storage Gen 2를 기준으로 하는 OneLake를 자동으로 프로비전합니다.

Azure Data Lake Store Gen2 파일 시스템을 만들려면 Azure Storage 계정의 계층 구조 네임스페이스 옵션을 사용해야 합니다. 스토리지 계정을 처음 만들 때 이 작업을 수행하거나 Data Lake Gen2를 지원하도록 기존 Azure Storage 계정을 업그레이드할 수 있습니다. 그러나 업그레이드는 단방향 프로세스입니다. Blob 스토리지에 계층 구조 네임스페이스를 지원하도록 스토리지 계정을 업그레이드한 후에는 단일 구조 네임스페이스로 되돌릴 수 없습니다.