在 Azure Databricks 中使用 Apache Spark
Azure Databricks 基于 Apache Spark 构建,可支持数据工程师和分析师运行 Spark 作业来大规模转换、分析和可视化数据。
学习目标
在本模块中,你将了解如何:
- 介绍 Apache Spark 体系结构的关键元素。
- 创建和配置 Spark 群集。
- 介绍 Spark 的用例。
- 使用 Spark 处理和分析文件中存储的数据。
- 使用 Spark 可视化数据。
先决条件
在开始本模块之前,应具备 Azure Databricks 的基础知识。 请考虑在此之前完成探索 Azure Databricks 模块。