Изучение потоков данных 2-го поколения в Microsoft Fabric
В Microsoft Fabric можно создать поток данных 2-го поколения в рабочей нагрузке фабрики данных или рабочей области Power BI или непосредственно в lakehouse. Так как наш сценарий ориентирован на прием данных, давайте рассмотрим рабочую нагрузку фабрики данных. Потоки данных 2-го поколения используют Power Query Online для визуализации преобразований. Ознакомьтесь с общими сведениями об интерфейсе:
1. Лента Power Query
Потоки данных 2-го поколения поддерживают широкий спектр соединителей источников данных. К общим источникам относятся облачные и локальные реляционные базы данных, Excel или неструктурированные файлы, SharePoint, SalesForce, Spark и, конечно, Fabric Lakehouses. Затем возможны многочисленные преобразования данных, такие как:
- Фильтрация и сортировка строк
- Сводка и отмена сводных данных
- Слияние и добавление запросов
- Разделение и условное разделение
- Замена значений и удаление дубликатов
- Добавление, переименование, изменение порядка или удаление столбцов
- Калькулятор ранга и процента
- Верхняя N и нижняя N
2. Область запросов
В области "Запросы" отображаются различные источники данных, которые теперь называются запросами. Переименование, дублирование, ссылка и включение промежуточного хранения — это некоторые доступные параметры.
3. Представление схемы
Представление диаграммы позволяет визуально видеть, как подключены источники данных и различные примененные преобразования.
4. Панель предварительного просмотра данных
В области предварительного просмотра данных отображается только подмножество данных, позволяющее увидеть, какие преобразования следует сделать и как они влияют на данные. Вы также можете взаимодействовать с панелью предварительного просмотра, перетаскивая столбцы, чтобы изменить порядок или щелкнуть правой кнопкой мыши столбцы для фильтрации или внесения изменений.
5. Область запроса Параметры
Область Параметры запроса в основном включает примененные шаги. Каждое преобразование, которое выполняется, привязано к шагу, некоторые из которых автоматически применяются при подключении источника данных. В зависимости от сложности преобразований может потребоваться несколько шагов для каждого запроса.
Хотя этот визуальный интерфейс полезен, вы также можете просмотреть код M с помощью расширенного редактора.
В области параметров запроса можно увидеть поле "Назначение данных", в котором можно задать Lakehouse в качестве места назначения.
Совет
При наличии аналитики данных также могут подключаться к потоку данных через Power BI Desktop.