Apache Spark gebruiken in Azure Databricks
Azure Databricks is gebaseerd op Apache Spark en stelt data engineers en analisten in staat Spark-taken uit te voeren om gegevens op schaal te transformeren, analyseren en visualiseren.
Leerdoelen
In deze module wordt het volgende behandeld:
- Beschrijf de belangrijkste elementen van de Apache Spark-architectuur.
- Een Spark-cluster maken en configureren.
- Gebruiksvoorbeelden voor Spark beschrijven.
- Spark gebruiken voor het verwerken en analyseren van gegevens die zijn opgeslagen in bestanden.
- Spark gebruiken om gegevens te visualiseren.
Vereisten
Voordat u deze module start, moet u basiskennis van Azure Databricks hebben. Overweeg om de Azure Databricks-module verkennen vóór deze te voltooien.