Zusammenfassung
Apache Spark ist eine wichtige Technologie, die in der Datentransformation und für die Big Data-Analyse verwendet wird. Mit der Spark-Unterstützung in Azure Databricks können Sie die Big Data-Verarbeitung in Spark mit umfangreichen Datenanalysen kombinieren.
In diesem Modul haben Sie Folgendes gelernt:
- Beschreiben Sie die wichtigsten Elemente der Apache Spark-Architektur.
- Erstellen und Konfigurieren eines Spark-Clusters
- Beschreiben der Anwendungsfälle für Spark
- Verwenden von Spark zum Verarbeiten und Analysieren von in Dateien gespeicherten Daten
- Verwenden von Spark zum Visualisieren von Daten.