Transformação de classificação em fluxo de dados de mapeamento
APLICA-SE A: Azure Data Factory Azure Synapse Analytics
Dica
Experimente o Data Factory no Microsoft Fabric, uma solução de análise tudo-em-um para empresas. O Microsoft Fabric abrange desde movimentação de dados até ciência de dados, análise em tempo real, business intelligence e relatórios. Saiba como iniciar uma avaliação gratuita!
Os fluxos de dados estão disponíveis nos pipelines do Azure Data Factory e do Azure Synapse. Este artigo se aplica ao fluxo de dados de mapeamento. Se você for iniciante nas transformações, veja o artigo introdutório Transformar dados usando um fluxo de dados de mapeamento.
Use a transformação de classificação para gerar uma classificação ordenada com base nas condições de classificação especificadas pelo usuário.
Configuração
Não diferenciar maiúsculas de minúsculas: se uma coluna classificada for do tipo de cadeia de caracteres, as maiúsculas e minúsculas serão fatoradas na classificação.
Denso: se habilitado, a coluna de classificação será classificada como densa. Cada contagem de classificação será um número consecutivo e os valores de classificação não serão ignorados após um empate.
Coluna de classificação: o nome da coluna de classificação gerada. Esta coluna será do tipo longo.
Condições de classificação: escolha quais colunas você está classificando e em qual ordem a classificação acontece. A ordem determina a prioridade de classificação.
A configuração acima usa dados de basquete de entrada e cria uma coluna de classificação chamada 'pointsRanking'. A linha com o valor mais alto da coluna PTS terá um valor pointsRanking de 1.
Script de fluxo de dados
Sintaxe
<incomingStream>
rank(
desc(<sortColumn1>),
asc(<sortColumn2>),
...,
caseInsensitive: { true | false }
dense: { true | false }
output(<rankColumn> as long)
) ~> <sortTransformationName<>
Exemplo
O script de fluxo de dados para a configuração de classificação acima está no trecho de código a seguir.
PruneColumns
rank(
desc(PTS, true),
caseInsensitive: false,
output(pointsRanking as long),
dense: false
) ~> RankByPoints
Conteúdo relacionado
Filtrar linhas com base nos valores de classificação usando a transformação de filtro.