Samenvatting

Voltooid

Apache Spark is een belangrijke technologie die wordt gebruikt voor gegevenstransformatie en big data-analyses. Met de Spark-ondersteuning in Azure Databricks kunt u big data-verwerking in Spark combineren met grootschalige gegevensanalyses.

In deze module hebt u het volgende geleerd:

  • Beschrijf de belangrijkste elementen van de Apache Spark-architectuur.
  • Een Spark-cluster maken en configureren.
  • Gebruiksvoorbeelden voor Spark beschrijven.
  • Spark gebruiken voor het verwerken en analyseren van gegevens die zijn opgeslagen in bestanden.
  • Spark gebruiken om gegevens te visualiseren.