Verwenden von Apache Spark in Azure Databricks
Azure Databricks basiert auf Apache Spark und ermöglicht es technischen Fachkräften für Daten und Analyst*innen, Spark-Aufträge auszuführen, um große Datenmengen zu transformieren, zu analysieren und zu visualisieren.
Lernziele
In diesem Modul lernen Sie Folgendes:
- Beschreiben der wichtigsten Elemente der Apache Spark-Architektur
- Erstellen und Konfigurieren eines Spark-Clusters
- Beschreiben der Anwendungsfälle für Spark
- Verwenden von Spark zum Verarbeiten und Analysieren von in Dateien gespeicherten Daten
- Verwenden von Spark zum Visualisieren von Daten
Voraussetzungen
Bevor Sie mit diesem Modul beginnen, sollten Sie über grundlegende Kenntnisse zu Azure Databricks verfügen. Erwägen Sie, das Modul Erkunden von Azure Databricks vor diesem Modul zu absolvieren.