Riepilogo
Apache Spark è una tecnologia chiave usata per la trasformazione dei dati e l'analisi dei Big Data. Il supporto di Spark in Azure Databricks consente di combinare l'elaborazione dei Big Data in Spark con analisi dei dati su larga scala.
Contenuto del modulo:
- Descrivere gli elementi chiave dell'architettura di Apache Spark.
- Creare e configurare un cluster Spark.
- Descrivere i casi d'uso per Spark.
- Usare Spark per elaborare e analizzare i dati archiviati nei file.
- Usare Spark per visualizzare i dati.