Compartilhar via


Mesclar transformação de contagem

Importante

O suporte para o Machine Learning Studio (clássico) terminará em 31 de agosto de 2024. É recomendável fazer a transição para o Azure Machine Learning até essa data.

A partir de 1º de dezembro de 2021, você não poderá criar recursos do Machine Learning Studio (clássico). Até 31 de agosto de 2024, você pode continuar usando os recursos existentes do Machine Learning Studio (clássico).

A documentação do ML Studio (clássico) está sendo desativada e pode não ser atualizada no futuro.

Cria um conjunto de recursos com base em uma tabela de contagens

Categoria: Learning com contagens

Observação

Aplica-se a: Machine Learning Studio (clássico) somente

Módulos semelhantes do tipo "arrastar e soltar" estão disponíveis no designer do Azure Machine Learning.

Visão geral do módulo

Este artigo descreve como usar o módulo Transformação Contagem de Mesclagem no Machine Learning Studio (clássico) para combinar dois conjuntos de recursos baseados em contagem. Mesclando dois conjuntos de contagens e recursos relacionados, você pode potencialmente melhorar a cobertura e a distribuição dos recursos.

Learning de contagens é particularmente útil em grandes conjuntos de dados com recursos de alta cardinalidade. A capacidade de combinar vários conjuntos de dados em conjuntos de recursos baseados em contagem sem precisar reprocessar os conjuntos de dados torna mais fácil coletar estatísticas em conjuntos de dados muito grandes e aplicá-los a novos conjuntos de dados. Por exemplo, as tabelas de contagem podem ser usadas para coletar informações sobre terabytes de dados. Você pode re-usar essas estatísticas para melhorar a precisão dos modelos preditivos em pequenos conjuntos de dados.

Para mesclar dois conjuntos de recursos baseados em contagem, os recursos devem ter sido criados usando tabelas que têm o mesmo esquema: ou seja, ambos os conjuntos devem usar as mesmas colunas e ter os mesmos nomes e tipos de dados.

Como configurar a transformação contagem de mesclagem

  1. Para usar a Transformação Contagem de Mesclagem, você deve ter criado pelo menos uma transformação baseada em contagem e essa transformação deve estar presente em seu workspace. Se você salvou uma transformação baseada em contagem de um experimento diferente, procure no grupo Transformações. Se você criou a transformação no experimento atual, conecte as saídas dos seguintes módulos:

    • Transformação contagem de build. Cria uma nova transformação baseada em contagem dos dados de origem.

    • Modificar parâmetros de tabela de contagem. Aceita uma transformação de contagem existente como uma entrada e saída de uma transformação atualizada.

    • Tabela de Contagem de Importação. Este módulo dá suporte à compatibilidade com versões regressivas com experimentos mais antigos que usavam o aprendizado baseado em contagem. Se você usou a Tabela de Contagem de Importação para analisar a distribuição de valores em um conjuntos de dados e, em seguida, converteu os valores em recursos usando o módulo do Count Featurizer preterido, use Importar Tabela de Contagem para converter os resultados em uma transformação.

  2. Adicione o módulo Transformação Contagem de Mesclagem ao experimento e conecte uma transformação a cada entrada.

    Dica

    A segunda transformação é uma entrada opcional – você pode conectar a mesma transformação duas vezes ou não conectar nada na segunda porta de entrada.

  3. Se você não quiser que o segundo conjuntos de dados seja ponderado igualmente com o primeiro, especifique um valor para Fator de decaimento. O valor que você digita indica como o conjunto de recursos da segunda transformação deve ser ponderado.

    Por exemplo, o valor padrão de 1 pondera ambos os conjuntos de recursos igualmente. Um valor de .5 significa que os recursos no segundo conjunto teriam metade do peso daqueles no primeiro conjunto.

  4. Opcionalmente, adicione uma instância do módulo Aplicar Transformação e aplique a transformação a um conjuntos de dados.

Exemplos

Para ver exemplos de como esse módulo é usado, consulte o Galeria de IA do Azure:

  • Learning com Contagens: Classificação Binária: demonstra como usar o aprendizado com módulos de contagens para gerar recursos de colunas de valores categóricos para um modelo de classificação binária.

  • Learning com Contagens: classificação multiclasse com dados de táxi de NYC: demonstra como usar o aprendizado com módulos de contagens para executar a classificação multiclasse no conjuntos de dados de táxi de NYC disponível publicamente. O exemplo usa um aluno de regressão logística multiclasse para modelar esse problema.

  • Learning com Contagens: classificação binária com dados de táxi de NYC: demonstra como usar o aprendizado com módulos de contagens para executar a classificação binária no conjuntos de dados de táxi de NYC disponível publicamente. O exemplo usa um aluno de regressão logística de duas classes para modelar o problema.

Entradas esperadas

Nome Tipo Descrição
Transformação de contagem anterior Interface ITransform A transformação de contagem a ser editada
Nova transformação de contagem Interface ITransform A transformação de contagem a ser acrescentada (opcional)

Parâmetros do módulo

Nome Tipo Intervalo Opcional Descrição Padrão
Fator de decaimento Float Necessária 1.0f O fator de decaimento a ser multiplicado para a transformação de contagem na porta de entrada à direita

Saídas

Nome Tipo Descrição
Transformação de contagem mesclada Interface ITransform A transformação mesclada

Exceções

Exceção Descrição
Erro 0003 Ocorrerá uma exceção se uma ou mais das entradas for nula ou estiver vazia.
Erro 0086 A exceção ocorre quando uma transformação de contagem é inválida.

Confira também

Aprendendo com contagens