Máquina do ponto Bayes de duas classes
Importante
O suporte para o Machine Learning Studio (clássico) terminará em 31 de agosto de 2024. É recomendável fazer a transição para o Azure Machine Learning até essa data.
A partir de 1º de dezembro de 2021, você não poderá criar recursos do Machine Learning Studio (clássico). Até 31 de agosto de 2024, você pode continuar usando os recursos existentes do Machine Learning Studio (clássico).
- Confira informações sobre como mover projetos de machine learning do ML Studio (clássico) para o Azure Machine Learning.
- Saiba mais sobre o Azure Machine Learning.
A documentação do ML Studio (clássico) está sendo desativada e pode não ser atualizada no futuro.
Cria um modelo de classificação binária da máquina no ponto Bayes
Categoria: Machine Learning/Inicializar modelo/classificação
Observação
Aplica-se a: Machine Learning Studio (clássico) somente
Módulos semelhantes do tipo "arrastar e soltar" estão disponíveis no designer do Azure Machine Learning.
Visão geral do módulo
Este artigo descreve como usar o módulo Computador de Ponto Bayes de Duas Classes no Machine Learning Studio (clássico) para criar um modelo de classificação binária sem treinamento.
O algoritmo neste módulo usa uma abordagem bayesiana para classificação linear chamada "Máquina de Ponto Bayes". Esse algoritmo aproxima com eficiência a média ideal teoricamente bayesiana de classificadores lineares (em termos de desempenho de generalização) escolhendo um classificador de "média", o Ponto Bayes. Como a Máquina do ponto Bayesiana é um modelo de classificação Bayesiana, não é propensa a sobreajuste para os dados de treinamento.
Para obter mais informações, consulte a postagem de Chris Ltda no blog do Microsoft Machine Learning: Adotando a incerteza – inferência probabilística.
Como configurar o Two-Class Bayes Point Machine
No Machine Learning Studio (clássico), adicione o módulo Computador de Ponto Bayes de Duas Classes ao seu experimento. Você pode encontrar o módulo em Machine Learning, Inicializar Modelo, Classificação.
Para Número de ierações de treinamento, digite um número para especificar a frequência com que o algoritmo de passagem de mensagem itera nos dados de treinamento. Normalmente, o número de iterações deve ser definido como um valor no intervalo de 5 a 100.
Quanto maior o número de iterações de treinamento, mais precisas as previsões; no entanto, o treinamento será mais lento.
Para a maioria dos conjuntos de dados, a configuração padrão de 30 iterações de treinamento é suficiente para o algoritmo fazer previsões precisas. Às vezes, previsões precisas podem ser feitas usando menos iterações. Para conjuntos de dados com recursos altamente correlacionados, você pode se beneficiar mais iterações de treinamento.
Selecione a opção Incluir desvio se quiser que um recurso constante ou desvio seja adicionado a cada instância no treinamento e na previsão.
Incluir uma compensação é necessária quando os dados ainda não contiverem um recurso constante.
Selecione a opção Permitir valores desconhecidos em recursos categóricos para criar um grupo para valores desconhecidos.
Se você desmarcar essa opção, o modelo pode aceitar apenas os valores que estão contidos nos dados de treinamento.
Se você selecionar essa opção e permitir valores desconhecidos, o modelo poderá ser menos preciso para valores conhecidos, mas poderá fornecer previsões melhores para novos valores (desconhecidos).
Adicione uma instância do módulo Treinar Modelo e seus dados de treinamento.
Conexão os dados de treinamento e a saída do módulo Computador de Ponto Bayes de Duas Classes para o módulo Modelo de Treinamento e escolha a coluna de rótulo.
Execute o experimento.
Resultados
Após a conclusão do treinamento, clique com o botão direito do mouse na saída do módulo Treinar Modelo para exibir os resultados:
Para ver um resumo dos parâmetros do modelo, junto com os pesos dos recursos aprendidos com o treinamento, selecione Visualizar.
Para salvar o modelo para uso posterior, clique com o botão direito do mouse na saída de Treinar MOdel e selecione Salvar como Modelo Treinado.
Para fazer previsões, use o modelo treinado como uma entrada para o módulo Modelo de Pontuação .
O modelo não treinado também pode ser passado para o Modelo de Validação Cruzada para validação cruzada em um conjunto de dados rotulado.
Exemplos
Para ver como o Two-Class Bayes Point Machine é usado no aprendizado de máquina, confira estes experimentos de exemplo no Galeria de IA do Azure:
- Comparar classificadores binários: este exemplo demonstra o uso de vários classificadores de duas classes.
Observações técnicas
Esta seção contém detalhes de implementação e perguntas frequentes sobre esse algoritmo.
Os detalhes da pesquisa original e da teoria subjacente estão disponíveis neste documento (PDF): Bayes Point Machines, by Allan, Graepe eAlt
No entanto, essa implementação melhora o algoritmo original de várias maneiras:
Usa o algoritmo de transmissão de mensagens de propagação de expectativa. Para obter mais informações, consulte Uma família de algoritmos para inferência bayesiana aproximada.
Uma limpeza de parâmetro não é necessária.
Esse método não exige que os dados sejam normalizados.
Essas melhorias tornam o modelo de classificação da Máquina do ponto Bayesiana mais robusto e fácil de usar e você pode ignorar a demorada etapa de ajuste de parâmetro.
Parâmetros do módulo
Nome | Intervalo | Type | Padrão | Descrição |
---|---|---|---|---|
Número de iterações de treinamento | >=1 | Integer | 30 | Especifique o número de iterações a ser usado durante o treinamento |
Incluir compensação | Qualquer | Booliano | verdadeiro | Indique se um recurso ou uma compensação constante deve ser adicionado a cada instância |
Permitir valores desconhecidos em recursos categóricos | Qualquer | Booliano | verdadeiro | Se True, cria um nível adicional para cada coluna categórica. Quaisquer níveis no conjunto de dados teste que não estão disponíveis no conjunto de dados de treinamento são mapeados para este nível adicional. |
Saída
Nome | Tipo | Descrição |
---|---|---|
Modelo não treinado | Interface ILearner | Um modelo de classificação binária não treinado |