Použití Apache Sparku v Azure Databricks
Azure Databricks je založený na Apache Sparku a umožňuje datovým inženýrům a analytikům spouštět úlohy Sparku pro transformaci, analýzu a vizualizaci dat ve velkém měřítku.
Cíle výuky
V tomto modulu:
- Popis klíčových prvků architektury Apache Spark
- Vytvoření a konfigurace clusteru Spark
- Popište případy použití Sparku.
- Pomocí Sparku můžete zpracovávat a analyzovat data uložená v souborech.
- Pomocí Sparku můžete vizualizovat data.
Požadavky
Než začnete s tímto modulem, měli byste mít základní znalosti Azure Databricks. Zvažte dokončení modulu Prozkoumat Azure Databricks před tímto modulem.