Использование Apache Spark в Microsoft Fabric

Средний уровень
Аналитик данных
Инженер по анализу и обработке данных
Microsoft Fabric

Apache Spark — это основная технология для аналитики данных в большом масштабе. Microsoft Fabric обеспечивает поддержку кластеров Spark, позволяя анализировать и обрабатывать данные в Lakehouse в большом масштабе.

Цели обучения

В этом модуле рассматриваются следующие задачи:

  • Настройка Spark в рабочей области Microsoft Fabric

  • Определение подходящих сценариев для записных книжек Spark и заданий Spark

  • Использование кадров данных Spark для анализа и преобразования данных

  • Использование Spark SQL для запроса данных в таблицах и представлениях

  • Визуализация данных в записной книжке Spark

Предварительные требования

Перед запуском этого модуля необходимо ознакомиться с интерфейсом Microsoft Fabric и основными понятиями.