Transformieren von Daten mit Spark in Azure Synapse Analytics

Fortgeschrittene Anfänger
Datentechniker
Azure Synapse Analytics

Technische Fachkräfte für Daten müssen in der Regel große Datenmengen transformieren. Apache Spark-Pools in Azure Synapse Analytics bieten eine verteilte Verarbeitungsplattform, mit der sie dieses Ziel erreichen können.

Lernziele

Dieses Modul umfasst Folgendes:

  • Verwenden von Apache Spark zum Ändern und Speichern von Dataframes
  • Partitionieren von Datendateien zur Verbesserung der Leistung und Skalierbarkeit
  • Transformieren von Daten mit SQL

Voraussetzungen

Bevor Sie dieses Modul absolvieren, sollten Sie sich mit Apache Spark-Pools in Azure Synapse Analytics vertraut machen. Erwägen Sie, zunächst das Modul Analysieren von Daten mit Apache Spark in Azure Synapse Analytics zu absolvieren.