Apache Spark gebruiken in Microsoft Fabric
Apache Spark is een kerntechnologie voor grootschalige gegevensanalyse. Microsoft Fabric biedt ondersteuning voor Spark-clusters, zodat u gegevens in een Lakehouse op schaal kunt analyseren en verwerken.
Leerdoelen
In deze module wordt het volgende behandeld:
Spark configureren in een Microsoft Fabric-werkruimte
Geschikte scenario's identificeren voor Spark-notebooks en Spark-taken
Spark-gegevensframes gebruiken om gegevens te analyseren en te transformeren
Spark SQL gebruiken om query's uit te voeren op gegevens in tabellen en weergaven
Gegevens visualiseren in een Spark-notebook
Vereisten
Voordat u deze module start, moet u bekend zijn met de Microsoft Fabric-interface en de belangrijkste concepten.