Introduzione

Completato

Apache Spark è un framework di elaborazione parallela open source per l'elaborazione e l'analisi dei dati su larga scala. Spark è diventato estremamente popolare negli scenari di elaborazione "Big Data" ed è disponibile in più implementazioni della piattaforma, tra cui Azure HDInsight, Azure Synapse Analytics e Microsoft Fabric.

Questo modulo illustra come usare Spark in Microsoft Fabric per inserire, elaborare e analizzare i dati in una lakehouse. Sebbene le tecniche di base e il codice descritti in questo modulo siano comuni a tutte le implementazioni di Spark, gli strumenti integrati e la possibilità di lavorare con Spark nello stesso ambiente degli altri servizi dati in Microsoft Fabric semplificano l'incorporamento dell'elaborazione dei dati basata su Spark nella soluzione di analisi dei dati complessiva.