Transformação de Janela no fluxo de dados de mapeamento
APLICA-SE A: Azure Data Factory
Azure Synapse Analytics
Dica
Experimente o Data Factory no Microsoft Fabric, uma solução de análise tudo-em-um para empresas. O Microsoft Fabric abrange desde movimentação de dados até ciência de dados, análise em tempo real, business intelligence e relatórios. Saiba como iniciar uma avaliação gratuita!
Os fluxos de dados estão disponíveis nos pipelines do Azure Data Factory e do Azure Synapse. Este artigo se aplica ao fluxo de dados de mapeamento. Se você for iniciante nas transformações, veja o artigo introdutório Transformar dados usando um fluxo de dados de mapeamento.
A Transformação de janela é o local em que você define agregações baseadas em janela de colunas em seus fluxos de dados. No Construtor de Expressões, é possível definir diferentes tipos de agregações baseadas em janelas de dados ou de tempo (cláusula SQL OVER) como LEAD, LAG, NTILE, CUMEDIST e RANK. Um novo campo é gerado na saída que inclui essas agregações. Também é possível incluir campos opcionais agrupar por.
Acima
Defina o particionamento dos dados da coluna para sua transformação de janela. O SQL equivalente é o Partition By
na cláusula Over no SQL. Se desejar criar um cálculo ou uma expressão a ser usada para o particionamento, será possível fazer isso passando o mouse sobre o nome da coluna e selecionando Coluna computada.
Sort
Outra parte da cláusula Over é a configuração de Order By
. Essa cláusula define a ordenação de classificação de dados. Também é possível criar uma expressão para um valor de cálculo nesse campo de coluna para classificação.
Ordenar por
Em seguida, defina o quadro de janela como Não associado ou Associado. Para definir um quadro de janela não associado, defina o controle deslizante como Não associado em ambas as extremidades. Se você escolher uma configuração entre a Linha não associada e a atual, deverá definir os valores de início e término do deslocamento. Ambos os valores são inteiros positivos. É possível usar números ou valores relativos dos seus dados.
O controle deslizante da janela tem dois valores a serem definidos: os valores antes da linha atual e os valores depois da linha atual. O deslocamento entre o início e o término corresponde aos dois seletores no controle deslizante.
Colunas da janela
Por fim, use o Construtor de Expressões para definir as agregações que você deseja usar com as janelas de dados como RANK, COUNT, MIN, MAX, DENSE RANK, LEAD, LAG, etc.
A lista completa de funções analíticas e de agregação disponível para você usar na Linguagem de Expressão do Fluxo de Dados por meio do Construtor de Expressões está listada em Expressões de transformação de dados no fluxo de dados de mapeamento.
Conteúdo relacionado
Se você estiver procurando uma agregação simples do tipo agrupar por, use a Transformação de agregação