Использование Apache Spark в Microsoft Fabric
Apache Spark — это основная технология для аналитики данных в большом масштабе. Microsoft Fabric обеспечивает поддержку кластеров Spark, позволяя анализировать и обрабатывать данные в Lakehouse в большом масштабе.
Цели обучения
В этом модуле рассматриваются следующие задачи:
Настройка Spark в рабочей области Microsoft Fabric
Определение подходящих сценариев для записных книжек Spark и заданий Spark
Использование кадров данных Spark для анализа и преобразования данных
Использование Spark SQL для запроса данных в таблицах и представлениях
Визуализация данных в записной книжке Spark
Предварительные требования
Перед запуском этого модуля необходимо ознакомиться с интерфейсом Microsoft Fabric и основными понятиями.