Transformação de janela no mapeamento do fluxo de dados
APLICA-SE A: Azure Data Factory Azure Synapse Analytics
Gorjeta
Experimente o Data Factory no Microsoft Fabric, uma solução de análise tudo-em-um para empresas. O Microsoft Fabric abrange tudo, desde a movimentação de dados até ciência de dados, análises em tempo real, business intelligence e relatórios. Saiba como iniciar uma nova avaliação gratuitamente!
Os fluxos de dados estão disponíveis no Azure Data Factory e no Azure Synapse Pipelines. Este artigo aplica-se ao mapeamento de fluxos de dados. Se você é novo em transformações, consulte o artigo introdutório Transformar dados usando um fluxo de dados de mapeamento.
A transformação Janela é onde você define agregações de colunas baseadas em janela em seus fluxos de dados. No Construtor de Expressões, você pode definir diferentes tipos de agregações baseadas em janelas de dados ou de tempo (cláusula SQL OVER), como LEAD, LAG, NTILE, CUMEDIST e RANK. Um novo campo é gerado em sua saída que inclui essas agregações. Você também pode incluir campos opcionais agrupados.
Mais de
Defina o particionamento de dados de coluna para a transformação da janela. O equivalente SQL é o Partition By
na cláusula Over em SQL. Se desejar criar um cálculo ou uma expressão para usar no particionamento, você pode fazer isso passando o mouse sobre o nome da coluna e selecionando Coluna computada.
Ordenar
Outra parte da cláusula Over é definir o Order By
. Esta cláusula define a ordem de classificação de dados. Você também pode criar uma expressão para calcular um valor neste campo de coluna para classificação.
Intervalo por
Em seguida, defina o quadro da janela como Unbounded ou Bounded. Para definir uma moldura de janela não limitada, defina o controle deslizante como Sem limites em ambas as extremidades. Se você escolher uma configuração entre Unbounded e Current Row, deverá definir os valores Offset start e end. Ambos os valores são inteiros positivos. Você pode usar números relativos ou valores de seus dados.
O controle deslizante da janela tem dois valores para definir: os valores antes da linha atual e os valores após a linha atual. O deslocamento entre o início e o fim corresponde aos dois seletores no controle deslizante.
Colunas de janela
Por fim, use o Construtor de Expressões para definir as agregações que deseja usar com as janelas de dados, como RANK, COUNT, MIN, MAX, DENSE RANK, LEAD, LAG, etc.
A lista completa de funções analíticas e de agregação disponíveis para uso na linguagem de expressão de fluxo de dados por meio do Construtor de expressões está listada em Expressões de transformação de dados no mapeamento de fluxo de dados.
Conteúdos relacionados
Se você estiver procurando por uma agregação simples por grupo, use a transformação Agregar