Использование Apache Spark в Microsoft Fabric
Apache Spark — это основная технология для аналитики данных в большом масштабе. Microsoft Fabric обеспечивает поддержку кластеров Spark, позволяя анализировать и обрабатывать данные в Lakehouse в большом масштабе.
Цели обучения
В этом модуле рассматриваются следующие задачи:
- Настройка Spark в рабочей области Microsoft Fabric
- Определение подходящих сценариев для записных книжек Spark и заданий Spark
- Использование Spark для подключения к данным soueces и приема данных
- Использование кадров данных Spark для анализа и преобразования данных
- Использование Spark SQL для запроса данных в таблицах и представлениях
- Визуализация данных в записной книжке Spark
Предварительные требования
Перед запуском этого модуля необходимо ознакомиться с интерфейсом Microsoft Fabric и основными понятиями.