Verwenden von Apache Spark in Azure Databricks

Fortgeschrittene Anfänger
Datentechniker
Azure Databricks

Azure Databricks basiert auf Apache Spark und ermöglicht es technischen Fachkräften für Daten und Analyst*innen, Spark-Aufträge auszuführen, um große Datenmengen zu transformieren, zu analysieren und zu visualisieren.

Lernziele

In diesem Modul lernen Sie Folgendes:

  • Beschreiben der wichtigsten Elemente der Apache Spark-Architektur
  • Erstellen und Konfigurieren eines Spark-Clusters
  • Beschreiben der Anwendungsfälle für Spark
  • Verwenden von Spark zum Verarbeiten und Analysieren von in Dateien gespeicherten Daten
  • Verwenden von Spark zum Visualisieren von Daten

Voraussetzungen

Bevor Sie mit diesem Modul beginnen, sollten Sie über grundlegende Kenntnisse zu Azure Databricks verfügen. Erwägen Sie, das Modul Erkunden von Azure Databricks vor diesem Modul zu absolvieren.