在 Azure Databricks 中使用 Apache Spark

模块
9 单元

中级

数据工程师

Azure Databricks

Azure Databricks 基于 Apache Spark 构建，可支持数据工程师和分析师运行 Spark 作业来大规模转换、分析和可视化数据。

学习目标

在本模块中，你将了解如何：

介绍 Apache Spark 体系结构的关键元素。
创建和配置 Spark 群集。
介绍 Spark 的用例。
使用 Spark 处理和分析文件中存储的数据。
使用 Spark 可视化数据。

先决条件

在开始本模块之前，应具备 Azure Databricks 的基础知识。请考虑在此之前完成探索 Azure Databricks 模块。