Shrnutí

Dokončeno

Apache Spark je klíčová technologie používaná při transformaci dat a analýze velkých objemů dat. Podpora Sparku v Azure Databricks umožňuje kombinovat zpracování velkých objemů dat ve Sparku s rozsáhlými analýzami dat.

V tomto modulu jste se naučili:

  • Popis klíčových prvků architektury Apache Spark
  • Vytvoření a konfigurace clusteru Spark
  • Popište případy použití Sparku.
  • Pomocí Sparku můžete zpracovávat a analyzovat data uložená v souborech.
  • Pomocí Sparku můžete vizualizovat data.