Partilhar via


transformação Amostragem Percentual

Aplica-se a: SQL Server SSIS Integration Runtime no Azure Data Factory

A transformação Amostragem Percentual cria um conjunto de dados de exemplo, selecionando um percentual das linhas de entrada da transformação. O conjunto de dados de exemplo é uma seleção aleatória das linhas da entrada da transformação, para que o exemplo resultante seja representativo da entrada.

Observação

Além do percentual especificado, a transformação Amostragem Percentual utiliza um algoritmo para determinar se uma linha pode ser incluída na saída de exemplo. Isso significa que o número de linhas na saída de exemplo pode não refletir exatamente o percentual especificado. Por exemplo, ao especificar 10% para um conjunto de dados de entrada com 25.000 linhas, é possível que não seja possível gerar uma amostra com 2.500 linhas. A amostra pode ter algumas linhas a menos ou a mais.

A transformação Amostragem Percentual é particularmente útil para mineração de dados. Utilizando-se essa transformação, você pode dividir aleatoriamente um conjunto de dados em dois: um para treinar o modelo de mineração de dados e o outro para testá-lo.

A transformação Amostragem Percentual também é útil para criar conjuntos de dados de exemplo para desenvolvimento de pacote. Aplicando-se a transformação Amostragem Percentual a um fluxo de dados, você pode reduzir de modo uniforme o tamanho do conjunto de dados, preservando as características de seus dados. O pacote de teste pode ser então executado mais rapidamente, pois ele usa um conjunto de dados pequeno, porém representativo.

Configuração da transformação Amostragem Percentual

Você pode especificar uma amostragem da semente para modificar o comportamento do gerador de números aleatórios que a transformação utiliza para selecionar linhas. Se a mesma amostragem da semente for utilizada, a transformação sempre criará a mesma saída de exemplo. Se nenhuma semente for especificada, a transformação usará a contagem de tiques do sistema operacional para criar o número aleatório. Portanto, você pode optar por utilizar uma semente padrão quando quiser verificar os resultados da transformação durante o desenvolvimento e teste de um pacote e, em seguida, fazer a alteração para utilizar uma semente aleatória quando o pacote for colocado em produção.

Essa transformação é semelhante à transformação Amostragem de Linhas, que cria um conjunto dados de exemplo, selecionando um número especificado de linhas de entrada. Para obter mais informações, consulte Row Sampling Transformation.

A transformação Amostragem Percentual inclui a propriedade personalizada SamplingValue . Essa propriedade pode ser atualizada por uma expressão de propriedade quando o pacote é carregado. Para obter mais informações, confira Expressões do Integration Services (SSIS), Usar Expressões de Propriedade em Pacotes e Propriedades Personalizadas da Transformação.

A transformação tem uma entrada e duas saídas. Não dá suporte a uma saída de erro.

Você pode definir propriedades pelo Designer do SSIS ou programaticamente.

A caixa de diálogo Editor Avançado reflete as propriedades que podem ser definidas programaticamente. Para obter mais informações sobre as propriedades que podem ser definidas na caixa de diálogo Editor Avançado ou programaticamente, clique em um dos seguintes tópicos:

Para obter mais informações sobre como definir as propriedades, consulte Definir as propriedades de um componente de fluxo de dados.

Editor de Transformação Amostragem Percentual

Use a caixa de diálogo Editor de Transformação Amostragem Percentual para dividir parte de uma entrada em uma amostra, usando uma porcentagem de linhas especificada. Essa transformação divide a entrada em duas saídas separadas.

Opções

Porcentagem de linhas
Especifique a porcentagem de linhas na entrada a usar como amostra.

O valor dessa propriedade pode ser especificado com uma expressão de propriedades.

Nome de saída do exemplo
Forneça um nome exclusivo para a saída que incluirá as linhas de amostra. O nome fornecido será exibido no Designer SSIS .

Nome de saída não selecionado
Forneça um nome exclusivo para a saída que conterá as linhas excluídas da amostragem. O nome fornecido será exibido no Designer SSIS .

Usar a seguinte semente aleatória
Especifique a semente de amostra para o gerador de números aleatórios que a transformação usa para criar uma amostra. Recomendado apenas para desenvolvimento e teste. A transformação usará a contagem de tiques do Microsoft Windows se não for especificada uma semente aleatória.