Usare Apache Spark in Azure Databricks
Azure Databricks è basato su Apache Spark e consente agli ingegneri dei dati e agli analisti di eseguire processi Spark per trasformare, analizzare e visualizzare i dati su larga scala.
Obiettivi di apprendimento
Contenuto del modulo:
- Descrivere gli elementi chiave dell'architettura di Apache Spark.
- Creare e configurare un cluster Spark.
- Descrivere i casi d'uso per Spark.
- Usare Spark per elaborare e analizzare i dati archiviati nei file.
- Usare Spark per visualizzare i dati.
Prerequisiti
Prima di iniziare questo modulo, è necessario avere una conoscenza di base di Azure Databricks. È consigliabile completare il modulo di Esplorare Azure Databricks prima di questo modulo.