Partilhar via


Máquina de pontos de Two-Class Bayes

Importante

O suporte para o Estúdio de ML (clássico) terminará a 31 de agosto de 2024. Recomendamos a transição para o Azure Machine Learning até essa data.

A partir de 1 de dezembro de 2021, não poderá criar novos recursos do Estúdio de ML (clássico). Até 31 de agosto de 2024, pode continuar a utilizar os recursos existentes do Estúdio de ML (clássico).

A documentação do Estúdio de ML (clássico) está a ser descontinuada e poderá não ser atualizada no futuro.

Cria um modelo de classificação binária de máquina de ponto bayes

Categoria: Machine Learning / Modelo de Inicialização / Classificação

Nota

Aplica-se a: Machine Learning Studio (clássico) apenas

Módulos semelhantes de arrasto e queda estão disponíveis em Azure Machine Learning designer.

Visão geral do módulo

Este artigo descreve como usar o módulo de duas classes Bayes Point Machine em Machine Learning Studio (clássico), para criar um modelo de classificação binária destreinada.

O algoritmo neste módulo usa uma abordagem bayesiana à classificação linear chamada "Bayes Point Machine". Este algoritmo aproxima-se eficientemente da média bayesiana teoricamente ideal de classificadores lineares (em termos de desempenho de generalização) ao escolher um classificador "médio", o Bayes Point. Como a Máquina de Bayes Point é um modelo de classificação bayesiano, não é propenso a adaptar-se aos dados de treino.

Para mais informações, consulte a publicação de Chris Bishop no blog microsoft Machine Learning: Abraçar a Incerteza - Inferência Probabilística.

Como configurar Two-Class Máquina de Pontos de Bayes

  1. Em Machine Learning Studio (clássico), adicione o módulo de duas classes Bayes Point Machine à sua experiência. Pode encontrar o módulo em Machine Learning, Modelo Inicialize, Classificação.

  2. Para o Número de iterações de treino, escreva um número para especificar com que frequência o algoritmo que passa a mensagem itera sobre os dados de treino. Normalmente, o número de iterações deve ser definido para um valor na gama 5 - 100.

    Quanto maior for o número de iterações de treino, mais precisas são as previsões; no entanto, o treino será mais lento.

    Para a maioria dos conjuntos de dados, a definição padrão de 30 iterações de treino é suficiente para que o algoritmo faça previsões precisas. Por vezes, previsões precisas podem ser feitas usando menos iterações. Para conjuntos de dados com funcionalidades altamente correlacionadas, poderá beneficiar de mais iterações de treino.

  3. Selecione a opção, Inclua o preconceito, se pretender que uma funcionalidade ou viés constante seja adicionado a cada instância no treino e na previsão.

    A inclusão de um enviesamento é necessária quando os dados já não contêm uma característica constante.

  4. Selecione a opção, Permita valores desconhecidos em funcionalidades categóricas, para criar um grupo para valores desconhecidos.

    Se desmarcar esta opção, o modelo só pode aceitar os valores contidos nos dados de treino.

    Se selecionar esta opção e permitir valores desconhecidos, o modelo poderá ser menos preciso para valores conhecidos, mas pode fornecer melhores previsões para novos valores (desconhecidos).

  5. Adicione uma instância do módulo Train Model e os seus dados de treino.

  6. Ligação os dados de formação e a saída do módulo de máquina de dois bayes point para o módulo Modelo de Comboio, e escolha a coluna de etiqueta.

  7. Execute a experimentação.

Resultados

Após o treino estar completo, clique à direita na saída do módulo Modelo de Comboio para ver os resultados:

  • Para ver um resumo dos parâmetros do modelo, juntamente com os pesos de recurso aprendidos com o treino, selecione Visualize.

  • Para guardar o modelo para utilização posterior, clique com o botão direito na saída do Comboio MOdel e selecione Save as Train Model.

  • Para fazer previsões, utilize o modelo treinado como entrada para o módulo 'Modelo de Pontuação '.

    O modelo não treinado também pode ser passado para o Modelo Cross-Validate para validação cruzada contra um conjunto de dados rotulado.

Exemplos

Para ver como a máquina de Two-Class Bayes Point é usada na aprendizagem automática, veja estas experiências de amostra na Galeria Azure AI:

Notas técnicas

Esta secção contém detalhes de implementação e perguntas frequentes sobre este algoritmo.

Detalhes da pesquisa original e teoria subjacente estão disponíveis neste artigo (PDF): Bayes Point Machines, por Herbert, Graepe e Campbell

No entanto, esta implementação melhora o algoritmo original de várias formas:

Estas melhorias tornam o modelo de classificação da Máquina de Pontos bayes mais robusto e mais fácil de usar, e pode contornar o passo demorado da afinação dos parâmetros.

Parâmetros do módulo

Nome Intervalo Tipo Predefinição Description
Número de iterações de formação >=1 Número inteiro 30 Especificar o número de iterações a utilizar durante o treino
Incluir preconceito Qualquer Booleano Verdadeiro Indicar se uma característica ou viés constante deve ser adicionado a cada instância
Permitir valores desconhecidos em características categóricas Qualquer Booleano Verdadeiro Se verdadeiro, cria um nível adicional para cada coluna categórica. Quaisquer níveis no conjunto de dados de teste que não estejam disponíveis no conjunto de dados de formação são mapeados para este nível adicional.

Saída

Nome Tipo Description
Modelo destreinado Interface ILearner Um modelo de classificação binária destreinada

Ver também

Listade Módulos ClassificationA-Z