Usare Apache Spark in Azure Databricks

Modulo
9 Unità

Intermedio

Data engineer

Azure Databricks

Azure Databricks è basato su Apache Spark e consente agli ingegneri dei dati e agli analisti di eseguire processi Spark per trasformare, analizzare e visualizzare i dati su larga scala.

Obiettivi di apprendimento

Contenuto del modulo:

Descrivere gli elementi chiave dell'architettura di Apache Spark.
Creare e configurare un cluster Spark.
Descrivere i casi d'uso per Spark.
Usare Spark per elaborare e analizzare i dati archiviati nei file.
Usare Spark per visualizzare i dati.

Prerequisiti

Prima di iniziare questo modulo, è necessario avere una conoscenza di base di Azure Databricks. È consigliabile completare il modulo di Esplorare Azure Databricks prima di questo modulo.

Introduzione min
Introduzione a Spark min
Creare un cluster Spark min
Usare Spark nei notebook min
Usare Spark su file di dati min
Visualizzare i dati min
Esercizio - Usare Spark in Azure Databricks min
Verifica delle conoscenze min
Riepilogo min