了解 Azure Data Lake Storage Gen2
Azure Data Lake Store (Gen1) 是分析 Data Lake 的分层数据的单独服务,通常由所谓的用于处理存储在文件中的结构化、半结构化和非结构化数据的大数据分析解决方案使用。 Azure Data Lake Storage Gen2 是该服务的较新版本,已集成到 Azure 存储中;使你能够利用 Blob 存储的可伸缩性和存储层的成本控制,并组合使用分层文件系统功能以及与 Azure Data Lake Store 的主要分析系统的兼容性。
Azure Databricks 等系统可以装载 Azure Data Lake Store Gen2 中托管的分布式文件系统,并使用它来处理大量数据。 Microsoft Fabric 租户可自动预配基于 Azure Data Lake Storage Gen2 构建的 OneLake。
若要创建 Azure Data Lake Store Gen2 文件系统,必须启用 Azure 存储帐户的“分层命名空间”选项。 可以在最初创建存储帐户时执行此操作,也可以升级现有 Azure 存储帐户以支持 Data Lake Gen2。 但请注意,升级是一个单向过程,在升级存储帐户以支持 Blob 存储的分层命名空间后,不能将其还原为平面命名空间。