Usare Apache Spark in Azure Databricks

Modulo
9 Unità

Intermedio

Data engineer

Azure Databricks

Azure Databricks è basato su Apache Spark e consente a data engineer e analisti di eseguire processi Spark per trasformare, analizzare e visualizzare i dati su larga scala.

Obiettivi di apprendimento

In questo modulo si apprenderà come:

Descrivere gli elementi chiave dell'architettura di Apache Spark.
Creare e configurare un cluster Spark.
Descrivere i casi d'uso per Spark.
Usare Spark per elaborare e analizzare i dati archiviati nei file.
Usare Spark per visualizzare i dati.

Prerequisiti

Prima di iniziare questo modulo, è necessario avere una conoscenza di base di Azure Databricks. È consigliabile completare il modulo esplora di Azure Databricks prima di questo modulo.

Introduzione min
Introduzione a Spark min
Creare un cluster Spark min
Usare Spark nei notebook min
Usare Spark su file di dati min
Visualizza i dati min
Esercizio - Usare Spark in Azure Databricks min
Valutazione del modulo min
Sommario min