Verwenden von Apache Spark in Azure Databricks
Azure Databricks basiert auf Apache Spark und ermöglicht Datentechnikern und Analysten, Spark-Aufträge auszuführen, um Daten im großen Maßstab zu transformieren, zu analysieren und zu visualisieren.
Lernziele
In diesem Modul erfahren Sie, wie Sie:
- Beschreiben Sie die wichtigsten Elemente der Apache Spark-Architektur.
- Erstellen und Konfigurieren eines Spark-Clusters
- Beschreiben der Anwendungsfälle für Spark
- Verwenden von Spark zum Verarbeiten und Analysieren von in Dateien gespeicherten Daten
- Verwenden von Spark zum Visualisieren von Daten.
Voraussetzungen
Bevor Sie mit diesem Modul beginnen, sollten Sie über grundlegende Kenntnisse von Azure Databricks verfügen. Erwägen Sie, die Azure Databricks Modul vor diesem Modul zu erkunden.