簡介

已完成

Apache Spark 是用於大規模資料處理和分析的開放原始碼平行處理架構。 Spark 在「巨量資料」處理案例中相當受歡迎,而且可在多個平台實作中使用;包括 Azure HDInsight、Azure Databricks 和 Azure Synapse Analytics。

本課程模組說明如何在 Azure Synapse Analytics 中使用 Spark 來擷取、處理和分析來自資料湖的資料。 雖然本課程模組中說明的核心技術和程式碼是所有 Spark 實作都通用的,但整合工具以及可與其他 Synapse 分析執行階段在相同環境中搭配 Spark 運作的功能,是 Azure Synapse Analytics 所特有的。

完成本課程模組之後,您將能夠:

  • 識別 Apache Spark 的核心特性和功能。
  • 在 Azure Synapse Analytics 中設定 Spark 集區。
  • 執行程式碼以載入、分析及視覺化 Spark 筆記本中的資料。