Partilhar via


Transformação de janela no mapeamento do fluxo de dados

APLICA-SE A: Azure Data Factory Azure Synapse Analytics

Gorjeta

Experimente o Data Factory no Microsoft Fabric, uma solução de análise tudo-em-um para empresas. O Microsoft Fabric abrange tudo, desde a movimentação de dados até ciência de dados, análises em tempo real, business intelligence e relatórios. Saiba como iniciar uma nova avaliação gratuitamente!

Os fluxos de dados estão disponíveis no Azure Data Factory e no Azure Synapse Pipelines. Este artigo aplica-se ao mapeamento de fluxos de dados. Se você é novo em transformações, consulte o artigo introdutório Transformar dados usando um fluxo de dados de mapeamento.

A transformação Janela é onde você define agregações de colunas baseadas em janela em seus fluxos de dados. No Construtor de Expressões, você pode definir diferentes tipos de agregações baseadas em janelas de dados ou de tempo (cláusula SQL OVER), como LEAD, LAG, NTILE, CUMEDIST e RANK. Um novo campo é gerado em sua saída que inclui essas agregações. Você também pode incluir campos opcionais agrupados.

A captura de tela mostra Janelas selecionadas no menu.

Mais de

Defina o particionamento de dados de coluna para a transformação da janela. O equivalente SQL é o Partition By na cláusula Over em SQL. Se desejar criar um cálculo ou uma expressão para usar no particionamento, você pode fazer isso passando o mouse sobre o nome da coluna e selecionando Coluna computada.

A captura de tela mostra as Configurações de janela com a guia Sobre selecionada.

Ordenar

Outra parte da cláusula Over é definir o Order By. Esta cláusula define a ordem de classificação de dados. Você também pode criar uma expressão para calcular um valor neste campo de coluna para classificação.

A captura de ecrã mostra as Definições de Janelas com o separador Ordenar selecionado.

Intervalo por

Em seguida, defina o quadro da janela como Unbounded ou Bounded. Para definir uma moldura de janela não limitada, defina o controle deslizante como Sem limites em ambas as extremidades. Se você escolher uma configuração entre Unbounded e Current Row, deverá definir os valores Offset start e end. Ambos os valores são inteiros positivos. Você pode usar números relativos ou valores de seus dados.

O controle deslizante da janela tem dois valores para definir: os valores antes da linha atual e os valores após a linha atual. O deslocamento entre o início e o fim corresponde aos dois seletores no controle deslizante.

A captura de tela mostra as Configurações de janela com a guia Intervalo por selecionada.

Colunas de janela

Por fim, use o Construtor de Expressões para definir as agregações que deseja usar com as janelas de dados, como RANK, COUNT, MIN, MAX, DENSE RANK, LEAD, LAG, etc.

A lista completa de funções analíticas e de agregação disponíveis para uso na linguagem de expressão de fluxo de dados por meio do Construtor de expressões está listada em Expressões de transformação de dados no mapeamento de fluxo de dados.

Se você estiver procurando por uma agregação simples por grupo, use a transformação Agregar