Modificar parâmetros de tabela de contagem
Importante
O suporte para o Estúdio de ML (clássico) terminará a 31 de agosto de 2024. Recomendamos a transição para o Azure Machine Learning até essa data.
A partir de 1 de dezembro de 2021, não poderá criar novos recursos do Estúdio de ML (clássico). Até 31 de agosto de 2024, pode continuar a utilizar os recursos existentes do Estúdio de ML (clássico).
- Consulte informações sobre projetos de machine learning em movimento de ML Studio (clássico) para Azure Machine Learning.
- Saiba mais sobre Azure Machine Learning.
A documentação do Estúdio de ML (clássico) está a ser descontinuada e poderá não ser atualizada no futuro.
Modifica os parâmetros utilizados para criar funcionalidades a partir de contagens
Categoria: Aprendizagem com Condes
Nota
Aplica-se a: Machine Learning Studio (clássico) apenas
Módulos semelhantes de arrasto e queda estão disponíveis em Azure Machine Learning designer.
Visão geral do módulo
Este artigo descreve como usar o módulo de parâmetros de tabela de contagem de modificação no Machine Learning Studio (clássico), para alterar a forma como as funcionalidades são geradas a partir de uma tabela de contagem.
Em geral, para criar funcionalidades baseadas na contagem, utiliza-se a Build Counting Transform para processar um conjunto de dados e criar uma tabela de contagem, e a partir dessa tabela de contagem gera um novo conjunto de funcionalidades.
No entanto, se já criou uma tabela de contagem, pode utilizar o módulo Descostódicos de Tabela De Modificação para editar a definição de como os dados da contagem são tratados. Isto permite-lhe criar um conjunto diferente de estatísticas baseadas na contagem com base nos dados existentes, sem ter que analisar o conjunto de dados.
Como configurar modificar parâmetros de contagem
Localize a transformação que pretende modificar, no grupo Transforms , e adicione-a à sua experiência.
Devias ter feito uma experiência que criou uma transformação de contagem.
Para modificar uma transformação salva: Localize a transformação, no grupo Transforms , e adicione-a à sua experiência.
Para modificar uma transformação de contagem criada dentro da mesma experiência: Se a transformação não tiver sido salva, mas estiver disponível como saída na experiência atual (por exemplo, verificar a saída do módulo Build Counting Transform ), pode utilizá-la diretamente ligando os módulos.
Adicione o módulo de parâmetros de tabela de contagem de modificação e conecte a transformação como uma entrada.
No painel de propriedades do módulo de parâmetros de tabela de modificação, digite um valor a utilizar como limiar do caixote do lixo.
Este valor especifica o número mínimo de ocorrências que devem ser encontradas para cada valor de recurso, para que as contagens sejam utilizadas. Se a frequência do valor for inferior ao limiar do caixote do lixo, o par de etiquetas de valor não é contabilizado como um item discreto; em vez disso, todos os itens com contagens inferiores ao valor limiar são colocados num único "caixote do lixo".
Se estiver a utilizar um pequeno conjunto de dados e estiver a contar e a treinar com os mesmos dados, um bom valor inicial é 1.
Para exemplos pseudo-exemplos adicionais, escreva um número que indique o número de pseudo-exemplos adicionais a incluir. Não é necessário dar estes exemplos; os pseudo exemplos são gerados com base na distribuição prévia.
Para a escala de ruído laplaciana, escreva um valor positivo de ponto flutuante que represente a escala utilizada para introduzir ruído amostrado de uma distribuição laplaciana. Quando se define um valor de escala, algum nível aceitável de ruído é incorporado no modelo, pelo que o modelo é menos suscetível de ser afetado por valores invisíveis nos dados.
Nas funcionalidades de Saída incluem,escolha o método a utilizar ao criar funcionalidades baseadas na contagem para inclusão na transformação.
CountsOnly: Criar funcionalidades utilizando contagens.
LogOddsOnly: Criar funcionalidades utilizando o registo da relação odds.
BothCountsAndLogOdds: Criar funcionalidades utilizando as probabilidades de contagem e de registo.
Selecione a opção Descodusar-se se pretender anular a
IsBackOff
bandeira na saída ao criar funcionalidades. Quando seleciona esta opção, as funcionalidades baseadas na contagem são criadas mesmo que a coluna não tenha valores significativos de contagem.Execute a experimentação. Em seguida, pode guardar a saída de Alterar parâmetros de tabela como uma nova transformação, se desejar.
Exemplos
Por exemplo, como este módulo, consulte a Galeria Azure AI:
Aprendizagem com Condes: Classificação Binária: Demonstra como usar a aprendizagem com módulos de contagem para gerar características de colunas de valores categóricos para um modelo de classificação binário.
Aprendizagem com Condes: Classificação multiclasse com dados de táxi nyc:sample Demonstra como usar a aprendizagem com módulos de contagem para executar classificação multiclasse no conjunto de dados de táxi de NYC disponível publicamente. A amostra utiliza um aprendiz de regressão logística multiclasse para modelar este problema.
Aprendizagem com Condes: Classificação binária com dados de táxi nyc: Demonstra como usar a aprendizagem com módulos de contagem para realizar classificação binária no conjunto de dados de táxi de NYC disponível publicamente. A amostra utiliza um aprendiz de regressão logística de duas classes para modelar este problema.
Notas técnicas
Esta secção contém detalhes de implementação, dicas e respostas a perguntas frequentes.
É estatisticamente seguro contar e treinar no mesmo conjunto de dados se definir o parâmetro da escala de ruído laplaciana.
Entradas esperadas
Nome | Tipo | Description |
---|---|---|
Contagem de transformação | Interface ITransform | A contagem transforma-se para aplicar |
Parâmetros do módulo
Nome | Tipo | Intervalo | Opcional | Predefinição | Description |
---|---|---|---|---|---|
Limiar do caixote do lixo | Float | >=0,0f | Necessário | 10.0f | O limiar sob o qual um valor de coluna será aparafusado contra o caixote do lixo |
Exemplos pseudo-anteriores adicionais | Float | >=0,0f | Necessário | 42.0f | Os pseudo exemplos adicionais que seguem as distribuições prévias a incluir |
Escala de ruído laplacian | Float | >=0,0f | Necessário | 0.0f | A escala da distribuição laplaciana a partir da qual o ruído é amostrado |
As funcionalidades de saída incluem | Modo de SaídaFeatureType | Necessário | BothCountsAndLogOdds | As características de saída | |
Ignore a coluna de trás | Booleano | Necessário | false | Se ignorar a coluna IsBackOff na saída |
Saídas
Nome | Tipo | Description |
---|---|---|
Transformação modificada | Interface ITransform | A transformação modificada |
Exceções
Exceção | Description |
---|---|
Erro 0003 | A exceção ocorre se uma ou mais entradas forem nulas ou vazias. |
Erro 0086 | A exceção ocorre quando uma transformação de contagem é inválida. |
Para obter uma lista de erros específicos dos módulos Studio (clássicos), consulte Machine Learning Códigos de Erro.
Para obter uma lista de exceções da API, consulte Machine Learning CÓDIGOs de Erro da API REST.