简介

已完成

Apache Spark 是用于大规模数据处理和分析的开源并行处理框架。 Spark 在“大数据”处理场景中很受欢迎,可在多个平台实现中使用,包括 Azure HDInsight、Azure Synapse Analytics 和 Microsoft Fabric。

本模块介绍如何在 Microsoft Fabric 中使用 Spark 来引入、处理和分析湖屋中的数据。 虽然本模块中所述的核心技术和代码对于所有 Spark 实现都是通用的,但集成的工具和在与 Microsoft Fabric 中的其他数据服务相同的环境中使用 Spark 的能力使得将基于 Spark 的数据处理合并到整体数据分析解决方案中变得更加容易。