在 Azure Synapse Analytics 中使用 Spark 转换数据
数据工程师通常需要转换大量数据。 Azure Synapse Analytics 中的 Apache Spark 池提供可用于实现此目标的分布式处理平台。
学习目标
通过学习本模块,你将了解如何:
- 使用 Apache Spark 修改和保存数据帧
- 对数据文件进行分区以提高性能和可伸缩性。
- 使用 SQL 转换数据
先决条件
在学习本模块之前,应熟悉 Azure Synapse Analytics 中的 Apache Spark 池。 请考虑先完成在 Azure Synapse Analytics 中使用 Apache Spark 分析数据模块。