简介

已完成

许多组织花费了过去二十年时间来基于关系数据库系统生成数据仓库和商业智能 (BI) 解决方案。 由于这些类型的数据和数据库的成本和复杂性较高,许多 BI 解决方案已失去了存储非结构化数据的机会。

数据湖已经成为这个问题的常见解决方案。 数据湖提供基于文件的存储,通常是分布式文件系统,支持海量数据的高扩展性。 组织可以在数据湖中存储结构化、半结构化和非结构化文件,然后采用大数据处理技术(如 Apache Spark)在其中使用这些文件。

Azure Data Lake Storage Gen2 为 Microsoft Azure 中的数据湖存储提供了基于云的解决方案,并支撑着许多基于 Azure 构建的大规模分析解决方案。