Partilhar via


Classificar a transformação no mapeamento do fluxo de dados

APLICA-SE A: Azure Data Factory Azure Synapse Analytics

Gorjeta

Experimente o Data Factory no Microsoft Fabric, uma solução de análise tudo-em-um para empresas. O Microsoft Fabric abrange tudo, desde a movimentação de dados até ciência de dados, análises em tempo real, business intelligence e relatórios. Saiba como iniciar uma nova avaliação gratuitamente!

Os fluxos de dados estão disponíveis no Azure Data Factory e no Azure Synapse Pipelines. Este artigo aplica-se ao mapeamento de fluxos de dados. Se você é novo em transformações, consulte o artigo introdutório Transformar dados usando um fluxo de dados de mapeamento.

Use a transformação de classificação para gerar uma classificação ordenada com base nas condições de classificação especificadas pelo usuário.

Configuração

Configurações de classificação

Não diferencia maiúsculas de minúsculas: se uma coluna de classificação for do tipo string, maiúsculas e minúsculas serão consideradas na classificação.

Dense: Se ativado, a coluna de classificação será classificada densamente. Cada contagem de classificação será um número consecutivo e os valores de classificação não serão ignorados após um empate.

Coluna de classificação: o nome da coluna de classificação gerada. Esta coluna será do tipo longa.

Condições de classificação: escolha por quais colunas você está classificando e em que ordem a classificação acontece. A ordem determina a prioridade de classificação.

A configuração acima pega os dados de basquete recebidos e cria uma coluna de classificação chamada 'pointsRanking'. A linha com o valor mais alto da coluna PTS terá um valor pointsRanking de 1.

Script de fluxo de dados

Sintaxe

<incomingStream>
    rank(
        desc(<sortColumn1>),
        asc(<sortColumn2>),
        ...,
        caseInsensitive: { true | false }
        dense: { true | false }
        output(<rankColumn> as long)
    ) ~> <sortTransformationName<>

Exemplo

Configurações de classificação

O script de fluxo de dados para a configuração de classificação acima está no trecho de código a seguir.

PruneColumns
    rank(
        desc(PTS, true),
        caseInsensitive: false,
        output(pointsRanking as long),
        dense: false
    ) ~> RankByPoints

Filtre linhas com base nos valores de classificação usando a transformação de filtro.