Samenvatting
Apache Spark is een belangrijke technologie die wordt gebruikt voor gegevenstransformatie en big data-analyses. Met de Spark-ondersteuning in Azure Databricks kunt u big data-verwerking in Spark combineren met grootschalige gegevensanalyses.
In deze module hebt u het volgende geleerd:
- Beschrijf de belangrijkste elementen van de Apache Spark-architectuur.
- Een Spark-cluster maken en configureren.
- Gebruiksvoorbeelden voor Spark beschrijven.
- Spark gebruiken voor het verwerken en analyseren van gegevens die zijn opgeslagen in bestanden.
- Spark gebruiken om gegevens te visualiseren.