Använda Apache Spark i Microsoft Fabric
Apache Spark är en kärnteknik för storskalig dataanalys. Microsoft Fabric har stöd för Spark-kluster så att du kan analysera och bearbeta data i en Lakehouse i stor skala.
Utbildningsmål
I den här modulen kommer du att:
- Konfigurera Spark på en Microsoft Fabric-arbetsyta
- Identifiera lämpliga scenarier för Spark-notebook-filer och Spark-jobb
- Använda Spark för att ansluta till data soueces och mata in data
- Använda Spark-dataramar för att analysera och transformera data
- Använda Spark SQL för att fråga efter data i tabeller och vyer
- Visualisera data i en Spark-notebook-fil
Förutsättningar
Innan du startar den här modulen bör du känna till Microsoft Fabric-gränssnittet och grundläggande begrepp.