Modificar parâmetros da tabela de contagem
Importante
O suporte para o Machine Learning Studio (clássico) terminará em 31 de agosto de 2024. É recomendável fazer a transição para o Azure Machine Learning até essa data.
A partir de 1º de dezembro de 2021, você não poderá criar recursos do Machine Learning Studio (clássico). Até 31 de agosto de 2024, você pode continuar usando os recursos existentes do Machine Learning Studio (clássico).
- Confira informações sobre como mover projetos de machine learning do ML Studio (clássico) para o Azure Machine Learning.
- Saiba mais sobre o Azure Machine Learning.
A documentação do ML Studio (clássico) está sendo desativada e pode não ser atualizada no futuro.
Modifica os parâmetros usados para criar recursos de contagens
categoria: Learning com contagens
Observação
aplica-se a: somente Machine Learning Studio (clássico)
Módulos semelhantes do tipo "arrastar e soltar" estão disponíveis no designer do Azure Machine Learning.
Visão geral do módulo
este artigo descreve como usar o módulo modificar parâmetros de tabela de contagem no Machine Learning Studio (clássico), para alterar a forma como os recursos são gerados a partir de uma tabela de contagem.
Em geral, para criar recursos baseados em contagem, você usa a transformação criar contagem para processar um conjunto de um e criar uma tabela de contagem, e a partir dessa tabela de contagem gera um novo conjunto de recursos.
No entanto, se você já tiver criado uma tabela de contagem, poderá usar o módulo Modificar parâmetros de tabela de contagem para editar a definição de como os dados de contagem são processados. Isso permite que você crie um conjunto diferente de estatísticas baseadas em contagem com base nos dados existentes, sem a necessidade de analisar novamente o DataSet.
Como configurar parâmetros de modificação de contagem
Localize a transformação que você deseja modificar, no grupo transformações e adicione-a ao seu experimento.
Você deve ter executado anteriormente um experimento que criou uma transformação de contagem.
Para modificar uma transformação salva: Localize a transformação, no grupo transformações e adicione-a ao seu experimento.
Para modificar uma transformação de contagem criada no mesmo experimento: se a transformação não tiver sido salva, mas estiver disponível como uma saída no experimento atual (por exemplo, verifique a saída do módulo criar transformação de contagem ), você poderá usá-la diretamente conectando os módulos.
Adicione o módulo Modificar parâmetros de tabela de contagem e conecte a transformação como uma entrada.
No painel Propriedades do módulo Modificar parâmetros de tabela de contagem , digite um valor a ser usado como olimite de compartimento de lixo.
Esse valor especifica o número mínimo de ocorrências que devem ser encontradas para cada valor de recurso, a fim de que as contagens sejam usadas. Se a frequência do valor for menor que o limite de compartimento de lixo, o par de rótulo de valor não será contado como um item discreto; em vez disso, todos os itens com contagens inferiores ao valor do limite são colocados em um único "compartimento de lixo".
Se você estiver usando um pequeno conjunto de dados e estiver contando e treinando os mesmos, um bom valor inicial será 1.
Para obter mais exemplos anteriores, digite um número que indique o número de pseudo exemplos adicionais a serem incluídos. Você não precisa fornecer estes exemplos; os pseudo exemplos são gerados com base na distribuição anterior.
Para a escala de ruído de laplaciana, digite um valor de ponto flutuante positivo que represente a escala usada para introduzir a amostra de ruído de uma distribuição laplaciana. Quando você define um valor de escala, um nível aceitável de ruído é incorporado ao modelo, portanto, é menos provável que o modelo seja afetado por valores não vistos nos dados.
Em recursos de saída incluem, escolha o método a ser usado ao criar recursos baseados em contagem para inclusão na transformação.
CountsOnly: criar recursos usando contagens.
LogOddsOnly: Crie recursos usando o log da taxa de chances.
BothCountsAndLogOdds: Crie recursos usando contagens e chances de log.
Selecione a opção ignorar coluna de retirada se desejar substituir o
IsBackOff
sinalizador na saída ao criar recursos. Quando você seleciona essa opção, os recursos baseados em contagem são criados mesmo que a coluna não tenha valores de contagem significativos.Execute o experimento. Em seguida, você pode salvar a saída de parâmetros da tabela de contagem de modificação como uma nova transformação, se desejado.
Exemplos
Para obter exemplos de como esse módulo, consulte o Galeria de ia do Azure:
Learning com contagens: classificação binária: demonstra como usar os módulos aprendendo com contagens para gerar recursos de colunas de valores categóricos para um modelo de classificação binária.
Learning com contagens: classificação multiclasse com dados de táxi de NYC: o exemplo demonstra como usar os módulos Learning with counts para executar a classificação multiclasse no conjunto de dados de táxi de NYC publicamente disponível. O exemplo usa um aprendiz de regressão logística multiclasse para modelar esse problema.
Learning com contagens: classificação binária com dados de táxis de NYC: demonstra como usar os módulos Learning with counts para executar a classificação binária no banco de dados de táxi de NYC publicamente disponível. O exemplo usa um aprendiz de regressão logística de duas classes para modelar esse problema.
Observações técnicas
Esta seção contém detalhes de implementação, dicas e respostas para perguntas frequentes.
É seguro estatisticamente contar e treinar no mesmo conjunto de dados se você definir o parâmetro de escala de ruído Laplaciana.
Entradas esperadas
Nome | Tipo | Descrição |
---|---|---|
Transformação de contagem | Interface ITransform | A transformação de contagem a ser aplicada |
Parâmetros do módulo
Nome | Tipo | Intervalo | Opcional | Padrão | Descrição |
---|---|---|---|---|---|
Limite de compartimento de lixo | Float | >= 0,0 f | Necessária | 10.0f | O limite sob o qual um valor de coluna será destacados em relação à lixeira de lixo |
Exemplos pseudo-anterior adicionais | Float | >= 0,0 f | Necessária | 42.0 f | Os exemplos pseudo adicionais após as distribuições anteriores a serem incluídos |
Escala de ruído Laplaciana | Float | >= 0,0 f | Necessária | 0,0 f | A escala da distribuição laplaciana da qual o ruído é amostrado |
Incluem recursos de saída | OutputFeatureType | Necessária | BothCountsAndLogOdds | Os recursos para saída | |
Ignorar a coluna de retirada | Boolean | Obrigatório | false | Se a coluna isretrocesso deve ser ignorada na saída |
Saídas
Nome | Tipo | Descrição |
---|---|---|
Transformação modificada | Interface ITransform | A transformação modificada |
Exceções
Exceção | Descrição |
---|---|
Erro 0003 | Ocorrerá uma exceção se uma ou mais das entradas for nula ou estiver vazia. |
Erro 0086 | A exceção ocorre quando uma transformação de contagem é inválida. |
para obter uma lista de erros específicos para módulos do Studio (clássicos), consulte Machine Learning códigos de erro.
para obter uma lista de exceções de api, consulte Machine Learning códigos de erro da api REST.