Introduzione

1 minuto

Apache Spark è un framework di elaborazione parallela open source per l'elaborazione e l'analisi dei dati su larga scala. Spark è diventato estremamente popolare negli scenari di elaborazione "Big Data" ed è disponibile in più implementazioni della piattaforma, tra cui Azure HDInsight, Azure Synapse Analytics e Microsoft Fabric.

Questo modulo illustra come usare Spark in Microsoft Fabric per inserire, elaborare e analizzare i dati in una lakehouse. Sebbene le tecniche di base e il codice descritti in questo modulo siano comuni a tutte le implementazioni di Spark, gli strumenti integrati e la possibilità di lavorare con Spark nello stesso ambiente degli altri servizi dati in Microsoft Fabric semplificano l'incorporamento dell'elaborazione dei dati basata su Spark nella soluzione di analisi dei dati complessiva.

Introduzione

Commenti e suggerimenti