Introduktion
Apache Spark är ett öppen källkod ramverk för parallell bearbetning för storskalig databearbetning och analys. Spark har blivit populärt i bearbetningsscenarier med stordata och är tillgängligt i flera plattformsimplementeringar. inklusive Azure HDInsight, Azure Synapse Analytics och Microsoft Fabric.
Den här modulen utforskar hur du kan använda Spark i Microsoft Fabric för att mata in, bearbeta och analysera data i ett sjöhus. De grundläggande teknikerna och koden som beskrivs i den här modulen är gemensamma för alla Spark-implementeringar, men de integrerade verktygen och möjligheten att arbeta med Spark i samma miljö som andra datatjänster i Microsoft Fabric gör det enklare att införliva Spark-baserad databehandling i din övergripande dataanalyslösning.