Podsumowanie

Ukończone

Apache Spark to kluczowa technologia używana w transformacji danych i analizie danych big data. Obsługa platformy Spark w usłudze Azure Databricks umożliwia łączenie przetwarzania danych big data na platformie Spark z analizą danych na dużą skalę.

W tym module przedstawiono informacje na temat wykonywania następujących czynności:

  • Opisz kluczowe elementy architektury platformy Apache Spark.
  • Tworzenie i konfigurowanie klastra Spark.
  • Opis przypadków użycia platformy Spark.
  • Platforma Spark umożliwia przetwarzanie i analizowanie danych przechowywanych w plikach.
  • Wizualizowanie danych przy użyciu platformy Spark.