Använda Apache Spark i Microsoft Fabric

Medel
Data Analyst
Data Engineer
Microsoft Fabric

Apache Spark är en kärnteknik för storskalig dataanalys. Microsoft Fabric har stöd för Spark-kluster så att du kan analysera och bearbeta data i en Lakehouse i stor skala.

Utbildningsmål

I den här modulen kommer du att:

  • Konfigurera Spark på en Microsoft Fabric-arbetsyta
  • Identifiera lämpliga scenarier för Spark-notebook-filer och Spark-jobb
  • Använda Spark för att ansluta till data soueces och mata in data
  • Använda Spark-dataramar för att analysera och transformera data
  • Använda Spark SQL för att fråga efter data i tabeller och vyer
  • Visualisera data i en Spark-notebook-fil

Förutsättningar

Innan du startar den här modulen bör du känna till Microsoft Fabric-gränssnittet och grundläggande begrepp.