Använda Apache Spark i Microsoft Fabric

Modul
9 Enheter

Medel

Data Analyst

Data Engineer

Microsoft Fabric

Apache Spark är en kärnteknik för storskalig dataanalys. Microsoft Fabric har stöd för Spark-kluster så att du kan analysera och bearbeta data i en Lakehouse i stor skala.

Utbildningsmål

I den här modulen kommer du att:

Konfigurera Spark på en Microsoft Fabric-arbetsyta
Identifiera lämpliga scenarier för Spark-notebook-filer och Spark-jobb
Använda Spark-dataramar för att analysera och transformera data
Använda Spark SQL för att fråga efter data i tabeller och vyer
Visualisera data i en Spark-notebook-fil

Förutsättningar

Innan du startar den här modulen bör du känna till Microsoft Fabric-gränssnittet och grundläggande begrepp.

Introduktion min
Förbereda för att använda Apache Spark min
Kör Spark-kod min
Arbeta med data i en Spark-dataram min
Arbeta med data med Spark SQL min
Visualisera data i en Spark-notebook-fil min
Övning – Analysera data med Apache Spark min
Kunskapstest min
Sammanfattning min