在 Azure Databricks 中使用 Apache Spark

中级
数据工程师
Azure Databricks

Azure Databricks 基于 Apache Spark 构建,可支持数据工程师和分析师运行 Spark 作业来大规模转换、分析和可视化数据。

学习目标

在本模块中,你将了解如何:

  • 介绍 Apache Spark 体系结构的关键元素。
  • 创建和配置 Spark 群集。
  • 介绍 Spark 的用例。
  • 使用 Spark 处理和分析文件中存储的数据。
  • 使用 Spark 可视化数据。

先决条件

在开始本模块之前,应具备 Azure Databricks 的基础知识。 请考虑在此之前完成探索 Azure Databricks 模块。