在 Azure Synapse Analytics 中使用 Spark 轉換資料
資料工程師通常需要轉換大量資料。 Azure Synapse Analytics 中的 Apache Spark 集區提供了分散式處理平台,他們可以使用該平台來實現此目標。
學習目標
在此課程模組中,您將了解如何:
- 使用 Apache Spark 修改及儲存資料框架
- 分割資料檔案,以改善效能和可擴縮性。
- 使用 SQL 轉換資料
必要條件
進行本課程模組之前,您應該先熟悉 Azure Synapse Analytics 中的 Apache Spark 集區。 請考慮先完成在 Azure Synapse Analytics 課程模組中使用 Apache Spark 分析資料。