Utiliser Apache Spark dans Azure Databricks
Azure Databricks repose sur Apache Spark et permet aux ingénieurs et analystes Données d’exécuter des travaux Spark pour transformer, analyser et visualiser des données à grande échelle.
Objectifs d’apprentissage
Dans ce module, vous allez découvrir comment :
- Décrire les éléments clés de l’architecture Apache Spark.
- Créer et configurer un cluster Spark.
- Décrire les cas d’usage pour Spark.
- Utiliser Spark pour traiter et analyser les données stockées dans des fichiers.
- Utiliser Spark pour visualiser les données.
Prérequis
Avant de commencer ce module, vous devez connaître les bases d’Azure Databricks. Envisagez de terminer le module Explorer Azure Databricks avant celui-ci.