Introduction

Effectué

Apache Spark est un framework de traitement parallèle open source pour le traitement et l’analytique à grande échelle des données. Spark est devenu populaire dans les scénarios de traitement de « Big Data » et est disponible dans plusieurs implémentations de plateforme, notamment Azure HDInsight, Azure Synapse Analytics et Microsoft Fabric.

Ce module explore comment utiliser Spark dans Microsoft Fabric pour ingérer, traiter et analyser les données d’un lakehouse. Bien que les techniques de base et le code décrits dans ce module soient communs à toutes les implémentations Spark, les outils intégrés et la capacité à travailler avec Spark dans le même environnement que d’autres services de données dans Microsoft Fabric facilitent l’intégration du traitement des données basé sur Spark dans votre solution d’analytique données globale.