Durchführen von Datentechnik mit Apache Spark-Pools in Azure Synapse

Lernpfad
3 Module

Fortgeschrittene Anfänger

Datentechniker

Azure Synapse Analytics

Apache Spark ist eine hochgradig skalierbare verteilte Verarbeitungslösung für Big Data-Analysen und -Transformationen. Sie können ihre Leistungsfähigkeit in Azure Synapse Analytics nutzen, indem Sie Spark-Pools verwenden.

Voraussetzungen

Bevor Sie mit diesem Lernpfad beginnen, sollten Sie sich mit Azure Synapse Analytics vertraut machen. Schließen Sie am besten zuerst das Modul Einführung in Azure Synapse Analytics ab.

Module in diesem Lernpfad

Analysieren von Daten mit Apache Spark in Azure Synapse Analytics

Apache Spark ist eine Kerntechnologie für umfassende Datenanalysen. Erfahren Sie, wie Sie Spark in Azure Synapse Analytics verwenden, um Daten in einem Data Lake zu analysieren und zu visualisieren.

Transformieren von Daten mit Spark in Azure Synapse Analytics

Technische Fachkräfte für Daten müssen in der Regel große Datenmengen transformieren. Apache Spark-Pools in Azure Synapse Analytics bieten eine verteilte Verarbeitungsplattform, mit der sie dieses Ziel erreichen können.

Verwenden von Delta Lake in Azure Synapse Analytics

Delta Lake ist ein relationaler Open-Source-Speicherbereich für Spark, den Sie für die Implementierung einer Data Lakehouse-Architektur in Azure Synapse Analytics verwenden können.