Сводка
Apache Spark — это ключевая технология, используемая в преобразовании данных и аналитике больших данных. Поддержка Spark в Azure Databricks позволяет объединить обработку больших данных в Spark с крупномасштабной аналитикой данных.
Из этого модуля вы узнали, как выполнять следующие задачи:
- описание ключевых элементов архитектуры Apache Spark;
- создание и настройка кластера Spark;
- описание вариантов использования Spark;
- использование Spark для обработки и анализа хранимых данных в файлах;
- визуализация данных с помощью Spark.