Utiliser Apache Spark dans Azure Databricks

Module
9 Unités

Intermédiaire

Ingénieur Data

Azure Databricks

Azure Databricks repose sur Apache Spark et permet aux ingénieurs et analystes Données d’exécuter des travaux Spark pour transformer, analyser et visualiser des données à grande échelle.

Objectifs d’apprentissage

Dans ce module, vous allez découvrir comment :

Décrire les éléments clés de l’architecture Apache Spark.
Créer et configurer un cluster Spark.
Décrire les cas d’usage pour Spark.
Utiliser Spark pour traiter et analyser les données stockées dans des fichiers.
Utiliser Spark pour visualiser les données.

Prérequis

Avant de commencer ce module, vous devez connaître les bases d’Azure Databricks. Envisagez de terminer le module Explorer Azure Databricks avant celui-ci.

Introduction min
Découvrir Spark min
Créer un cluster Spark min
Utiliser Spark dans les notebooks min
Utiliser Spark pour travailler avec des fichiers de données min
Visualiser les données min
Exercice - Utiliser Spark dans Azure Databricks min
Contrôle des connaissances min
Résumé min