Classificar a transformação no mapeamento do fluxo de dados
APLICA-SE A: Azure Data Factory Azure Synapse Analytics
Gorjeta
Experimente o Data Factory no Microsoft Fabric, uma solução de análise tudo-em-um para empresas. O Microsoft Fabric abrange tudo, desde a movimentação de dados até ciência de dados, análises em tempo real, business intelligence e relatórios. Saiba como iniciar uma nova avaliação gratuitamente!
Os fluxos de dados estão disponíveis no Azure Data Factory e no Azure Synapse Pipelines. Este artigo aplica-se ao mapeamento de fluxos de dados. Se você é novo em transformações, consulte o artigo introdutório Transformar dados usando um fluxo de dados de mapeamento.
Use a transformação de classificação para gerar uma classificação ordenada com base nas condições de classificação especificadas pelo usuário.
Configuração
Não diferencia maiúsculas de minúsculas: se uma coluna de classificação for do tipo string, maiúsculas e minúsculas serão consideradas na classificação.
Dense: Se ativado, a coluna de classificação será classificada densamente. Cada contagem de classificação será um número consecutivo e os valores de classificação não serão ignorados após um empate.
Coluna de classificação: o nome da coluna de classificação gerada. Esta coluna será do tipo longa.
Condições de classificação: escolha por quais colunas você está classificando e em que ordem a classificação acontece. A ordem determina a prioridade de classificação.
A configuração acima pega os dados de basquete recebidos e cria uma coluna de classificação chamada 'pointsRanking'. A linha com o valor mais alto da coluna PTS terá um valor pointsRanking de 1.
Script de fluxo de dados
Sintaxe
<incomingStream>
rank(
desc(<sortColumn1>),
asc(<sortColumn2>),
...,
caseInsensitive: { true | false }
dense: { true | false }
output(<rankColumn> as long)
) ~> <sortTransformationName<>
Exemplo
O script de fluxo de dados para a configuração de classificação acima está no trecho de código a seguir.
PruneColumns
rank(
desc(PTS, true),
caseInsensitive: false,
output(pointsRanking as long),
dense: false
) ~> RankByPoints
Conteúdos relacionados
Filtre linhas com base nos valores de classificação usando a transformação de filtro.