Поделиться через


Преобразование окна в потоке данных для сопоставления

ОБЛАСТЬ ПРИМЕНЕНИЯ: Фабрика данных Azure Azure Synapse Analytics

Совет

Попробуйте использовать фабрику данных в Microsoft Fabric, решение для аналитики с одним интерфейсом для предприятий. Microsoft Fabric охватывает все, от перемещения данных до обработки и анализа данных в режиме реального времени, бизнес-аналитики и отчетности. Узнайте, как бесплатно запустить новую пробную версию !

Потоки данных доступны в конвейерах как Фабрики данных Azure, так и Azure Synapse. Эта статья относится к потокам данных для сопоставления. Если вы не знакомы с преобразованиями, см. вводную статью Преобразование данных с помощью потока данных для сопоставления.

Преобразование "Окно" определяет агрегирование столбцов в потоках данных на основе окна. В построителе выражений можно определить различные типы агрегатов, основанные на данных или временных окнах (предложение SQL OVER), таких как LEAD, LAG, NTILE, CUMEDIST и RANK. В выходных данных создается новое поле, включающее эти агрегаты. Вы также можете включить дополнительные поля "Группировать по".

Снимок экрана: меню с выбранным пунктом

Более

Задайте секционирование данных столбцов для своего преобразования окна. Эквивалент в SQL — это параметр Partition By в предложении Over в SQL. Если вы хотите создать вычисление или создать выражение для секционирования, это можно сделать, наведите указатель мыши на имя столбца и выберите вычисляемый столбец.

Снимок экрана: параметры работы с окнами с выбранной вкладкой

Сортировать

Еще одна функция предложения Over —это установка параметра Order By. Это предложение задает порядок сортировки данных. Вы также можете создать выражение для значения расчета в этом поле столбца для сортировки.

Снимок экрана: параметры работы с окнами с выбранной вкладкой

Range By

Затем задайте для рамки окна параметр "Неограниченная" или "Ограниченная". Чтобы сделать рамку окна неограниченной, установите ползунок в положение "Неограниченная" с двух концов. Если вы выберете вариант между положениями "Неограниченная" и "Текущая строка", вам нужно задать начальное и конечное значение смещения. Оба значения являются положительными целыми числами. Вы можете использовать относительные числа или значения из своих данных.

Ползунок окна задает два значения: значения перед текущей строкой и значения после текущей строки. Смещение между начальным и конечным совпадает с двумя селекторами на ползунке.

Снимок экрана: параметры окна с выбранной вкладкой

Столбцы окна

Наконец, с помощью построителя выражений определите объединения, которые вы хотите использовать с окнами данных, например RANK, COUNT, MIN, MAX, DENSE RANK, LEAD, LAG и т. д.

Полный список агрегатных и аналитических функций, которые доступны для использования в языке выражений потоков данных ADF в построителе выражений, приведен в разделе Выражения преобразования данных в потоке данных для сопоставления.

Если вы ищете простую агрегирование по группам, используйте преобразование "Агрегат"