在 Azure Synapse Analytics 中使用 Spark 转换数据

中级
数据工程师
Azure Synapse Analytics

数据工程师通常需要转换大量数据。 Azure Synapse Analytics 中的 Apache Spark 池提供可用于实现此目标的分布式处理平台。

学习目标

通过学习本模块,你将了解如何:

  • 使用 Apache Spark 修改和保存数据帧
  • 对数据文件进行分区以提高性能和可伸缩性。
  • 使用 SQL 转换数据

先决条件

在学习本模块之前,应熟悉 Azure Synapse Analytics 中的 Apache Spark 池。 请考虑先完成在 Azure Synapse Analytics 中使用 Apache Spark 分析数据模块。