Compartilhar via


Máquina do ponto Bayes de duas classes

Importante

O suporte para o Machine Learning Studio (clássico) terminará em 31 de agosto de 2024. É recomendável fazer a transição para o Azure Machine Learning até essa data.

A partir de 1º de dezembro de 2021, você não poderá criar recursos do Machine Learning Studio (clássico). Até 31 de agosto de 2024, você pode continuar usando os recursos existentes do Machine Learning Studio (clássico).

A documentação do ML Studio (clássico) está sendo desativada e pode não ser atualizada no futuro.

Cria um modelo de classificação binária da máquina no ponto Bayes

Categoria: Machine Learning/Inicializar modelo/classificação

Observação

Aplica-se a: Machine Learning Studio (clássico) somente

Módulos semelhantes do tipo "arrastar e soltar" estão disponíveis no designer do Azure Machine Learning.

Visão geral do módulo

Este artigo descreve como usar o módulo Computador de Ponto Bayes de Duas Classes no Machine Learning Studio (clássico) para criar um modelo de classificação binária sem treinamento.

O algoritmo neste módulo usa uma abordagem bayesiana para classificação linear chamada "Máquina de Ponto Bayes". Esse algoritmo aproxima com eficiência a média ideal teoricamente bayesiana de classificadores lineares (em termos de desempenho de generalização) escolhendo um classificador de "média", o Ponto Bayes. Como a Máquina do ponto Bayesiana é um modelo de classificação Bayesiana, não é propensa a sobreajuste para os dados de treinamento.

Para obter mais informações, consulte a postagem de Chris Ltda no blog do Microsoft Machine Learning: Adotando a incerteza – inferência probabilística.

Como configurar o Two-Class Bayes Point Machine

  1. No Machine Learning Studio (clássico), adicione o módulo Computador de Ponto Bayes de Duas Classes ao seu experimento. Você pode encontrar o módulo em Machine Learning, Inicializar Modelo, Classificação.

  2. Para Número de ierações de treinamento, digite um número para especificar a frequência com que o algoritmo de passagem de mensagem itera nos dados de treinamento. Normalmente, o número de iterações deve ser definido como um valor no intervalo de 5 a 100.

    Quanto maior o número de iterações de treinamento, mais precisas as previsões; no entanto, o treinamento será mais lento.

    Para a maioria dos conjuntos de dados, a configuração padrão de 30 iterações de treinamento é suficiente para o algoritmo fazer previsões precisas. Às vezes, previsões precisas podem ser feitas usando menos iterações. Para conjuntos de dados com recursos altamente correlacionados, você pode se beneficiar mais iterações de treinamento.

  3. Selecione a opção Incluir desvio se quiser que um recurso constante ou desvio seja adicionado a cada instância no treinamento e na previsão.

    Incluir uma compensação é necessária quando os dados ainda não contiverem um recurso constante.

  4. Selecione a opção Permitir valores desconhecidos em recursos categóricos para criar um grupo para valores desconhecidos.

    Se você desmarcar essa opção, o modelo pode aceitar apenas os valores que estão contidos nos dados de treinamento.

    Se você selecionar essa opção e permitir valores desconhecidos, o modelo poderá ser menos preciso para valores conhecidos, mas poderá fornecer previsões melhores para novos valores (desconhecidos).

  5. Adicione uma instância do módulo Treinar Modelo e seus dados de treinamento.

  6. Conexão os dados de treinamento e a saída do módulo Computador de Ponto Bayes de Duas Classes para o módulo Modelo de Treinamento e escolha a coluna de rótulo.

  7. Execute o experimento.

Resultados

Após a conclusão do treinamento, clique com o botão direito do mouse na saída do módulo Treinar Modelo para exibir os resultados:

  • Para ver um resumo dos parâmetros do modelo, junto com os pesos dos recursos aprendidos com o treinamento, selecione Visualizar.

  • Para salvar o modelo para uso posterior, clique com o botão direito do mouse na saída de Treinar MOdel e selecione Salvar como Modelo Treinado.

  • Para fazer previsões, use o modelo treinado como uma entrada para o módulo Modelo de Pontuação .

    O modelo não treinado também pode ser passado para o Modelo de Validação Cruzada para validação cruzada em um conjunto de dados rotulado.

Exemplos

Para ver como o Two-Class Bayes Point Machine é usado no aprendizado de máquina, confira estes experimentos de exemplo no Galeria de IA do Azure:

Observações técnicas

Esta seção contém detalhes de implementação e perguntas frequentes sobre esse algoritmo.

Os detalhes da pesquisa original e da teoria subjacente estão disponíveis neste documento (PDF): Bayes Point Machines, by Allan, Graepe eAlt

No entanto, essa implementação melhora o algoritmo original de várias maneiras:

Essas melhorias tornam o modelo de classificação da Máquina do ponto Bayesiana mais robusto e fácil de usar e você pode ignorar a demorada etapa de ajuste de parâmetro.

Parâmetros do módulo

Nome Intervalo Type Padrão Descrição
Número de iterações de treinamento >=1 Integer 30 Especifique o número de iterações a ser usado durante o treinamento
Incluir compensação Qualquer Booliano verdadeiro Indique se um recurso ou uma compensação constante deve ser adicionado a cada instância
Permitir valores desconhecidos em recursos categóricos Qualquer Booliano verdadeiro Se True, cria um nível adicional para cada coluna categórica. Quaisquer níveis no conjunto de dados teste que não estão disponíveis no conjunto de dados de treinamento são mapeados para este nível adicional.

Saída

Nome Tipo Descrição
Modelo não treinado Interface ILearner Um modelo de classificação binária não treinado

Confira também

Lista demódulos ClassificationA-Z