Usare Apache Spark in Azure Databricks
Azure Databricks è basato su Apache Spark e consente a data engineer e analisti di eseguire processi Spark per trasformare, analizzare e visualizzare i dati su larga scala.
Obiettivi di apprendimento
In questo modulo si apprenderà come:
- Descrivere gli elementi chiave dell'architettura di Apache Spark.
- Creare e configurare un cluster Spark.
- Descrivere i casi d'uso per Spark.
- Usare Spark per elaborare e analizzare i dati archiviati nei file.
- Usare Spark per visualizzare i dati.
Prerequisiti
Prima di iniziare questo modulo, è necessario avere una conoscenza di base di Azure Databricks. È consigliabile completare il modulo esplora di Azure Databricks prima di questo modulo.