Реализация Lakehouse с помощью Microsoft Fabric

intermediate
data-analyst
data-engineer
data-scientist
fabric

В этой схеме обучения представлены базовые компоненты реализации озера данных с помощью Microsoft Fabric.

Предварительные требования

Вы должны быть знакомы с основными понятиями и терминологией, связанных с данными.

Модули, включенные в эту схему обучения

Узнайте, как Microsoft Fabric может соответствовать потребностям аналитики предприятия на одной платформе. Узнайте о Microsoft Fabric, о том, как оно работает, и определите, как его можно использовать для ваших потребностей аналитики.

Lakehouses объединяет гибкость хранилища озера данных с аналитикой хранилища данных. Microsoft Fabric предлагает решение Lakehouse для комплексной аналитики на одной платформе SaaS.

Apache Spark — это основная технология для аналитики данных в большом масштабе. Microsoft Fabric обеспечивает поддержку кластеров Spark, позволяя анализировать и обрабатывать данные в Lakehouse в большом масштабе.

Таблицы в озере Microsoft Fabric основаны на формате хранилища Delta Lake, который часто используется в Apache Spark. С помощью расширенных возможностей разностных таблиц можно создавать решения расширенной аналитики.

Прием данных имеет решающее значение в аналитике. Фабрика данных Microsoft Fabric предлагает потоки данных для визуального создания многоэтапного приема и преобразования данных с помощью Power Query Online.

Microsoft Fabric включает возможности фабрики данных, включая возможность создания конвейеров, которые оркестрирует прием данных и задачи преобразования.

Изучите потенциал архитектуры медальона в Microsoft Fabric. Упорядочение и преобразование данных между слоями Бронзы, Silver и Gold в лейкхаусе для оптимизации аналитики.