Inleiding
Apache Spark is een opensource-framework voor parallelle verwerking voor grootschalige gegevensverwerking en -analyse. Spark is populair geworden in 'big data'-verwerkingsscenario's en is beschikbaar in meerdere platform-implementaties; waaronder Azure HDInsight, Azure Synapse Analytics en Microsoft Fabric.
In deze module wordt beschreven hoe u Spark in Microsoft Fabric kunt gebruiken om gegevens in een lakehouse op te nemen, te verwerken en te analyseren. Hoewel de belangrijkste technieken en code die in deze module worden beschreven, gebruikelijk zijn voor alle Spark-implementaties, maken de geïntegreerde hulpprogramma's en de mogelijkheid om met Spark te werken in dezelfde omgeving als andere gegevensservices in Microsoft Fabric het eenvoudiger om op Spark gebaseerde gegevensverwerking op te nemen in uw algemene oplossing voor gegevensanalyse.