まとめ
Apache Spark は、ビッグ データの分析で使用される主要なテクノロジであり、Azure Synapse Analytics での Spark プールのサポートを利用すると、Spark でのビッグ データの処理と、SQL での大規模なデータ ウェアハウジングを組み合わせることができます。
このモジュールでは、以下の方法について学習しました。
- Apache Spark の中心的機能を確認します。
- Azure Synapse Analytics で Spark プールを構成します。
- Spark ノートブックでデータを読み込み、分析し、視覚化するコードを実行します。