Verwenden von Apache Spark in Azure Databricks

Modul
9 Einheiten

Fortgeschrittene Anfänger

Datentechniker

Azure Databricks

Azure Databricks basiert auf Apache Spark und ermöglicht Datentechnikern und Analysten, Spark-Aufträge auszuführen, um Daten im großen Maßstab zu transformieren, zu analysieren und zu visualisieren.

Lernziele

In diesem Modul erfahren Sie, wie Sie:

Beschreiben Sie die wichtigsten Elemente der Apache Spark-Architektur.
Erstellen und Konfigurieren eines Spark-Clusters
Beschreiben der Anwendungsfälle für Spark
Verwenden von Spark zum Verarbeiten und Analysieren von in Dateien gespeicherten Daten
Verwenden von Spark zum Visualisieren von Daten.

Voraussetzungen

Bevor Sie mit diesem Modul beginnen, sollten Sie über grundlegende Kenntnisse von Azure Databricks verfügen. Erwägen Sie, die Azure Databricks Modul vor diesem Modul zu erkunden.

Einleitung min
Einführung in Spark min
Erstellen eines Spark-Clusters min
Verwenden von Spark in Notebooks min
Verwenden von Spark zum Arbeiten mit Datendateien min
Visualisieren von Daten min
Übung : Verwenden von Spark in Azure Databricks min
Wissensüberprüfung min
Zusammenfassung min