Durchführen von Datentechnik mit Apache Spark-Pools in Azure Synapse

Fortgeschrittene Anfänger
Datentechniker
Azure Synapse Analytics

Apache Spark ist eine hochgradig skalierbare verteilte Verarbeitungslösung für Big Data-Analysen und -Transformationen. Sie können ihre Leistungsfähigkeit in Azure Synapse Analytics nutzen, indem Sie Spark-Pools verwenden.

Voraussetzungen

Bevor Sie mit diesem Lernpfad beginnen, sollten Sie sich mit Azure Synapse Analytics vertraut machen. Schließen Sie am besten zuerst das Modul Einführung in Azure Synapse Analytics ab.

Module in diesem Lernpfad

Apache Spark ist eine Kerntechnologie für umfassende Datenanalysen. Erfahren Sie, wie Sie Spark in Azure Synapse Analytics verwenden, um Daten in einem Data Lake zu analysieren und zu visualisieren.

Technische Fachkräfte für Daten müssen in der Regel große Datenmengen transformieren. Apache Spark-Pools in Azure Synapse Analytics bieten eine verteilte Verarbeitungsplattform, mit der sie dieses Ziel erreichen können.

Delta Lake ist ein relationaler Open-Source-Speicherbereich für Spark, den Sie für die Implementierung einer Data Lakehouse-Architektur in Azure Synapse Analytics verwenden können.