Использование Apache Spark в Microsoft Fabric

Средний уровень
Аналитик данных
Инженер по анализу и обработке данных
Microsoft Fabric

Apache Spark — это основная технология для аналитики данных в большом масштабе. Microsoft Fabric обеспечивает поддержку кластеров Spark, позволяя анализировать и обрабатывать данные в Lakehouse в большом масштабе.

Цели обучения

В этом модуле рассматриваются следующие задачи:

  • Настройка Spark в рабочей области Microsoft Fabric
  • Определение подходящих сценариев для записных книжек Spark и заданий Spark
  • Использование Spark для подключения к данным soueces и приема данных
  • Использование кадров данных Spark для анализа и преобразования данных
  • Использование Spark SQL для запроса данных в таблицах и представлениях
  • Визуализация данных в записной книжке Spark

Предварительные требования

Перед запуском этого модуля необходимо ознакомиться с интерфейсом Microsoft Fabric и основными понятиями.