Máquina de pontos de Two-Class Bayes
Importante
O suporte para o Estúdio de ML (clássico) terminará a 31 de agosto de 2024. Recomendamos a transição para o Azure Machine Learning até essa data.
A partir de 1 de dezembro de 2021, não poderá criar novos recursos do Estúdio de ML (clássico). Até 31 de agosto de 2024, pode continuar a utilizar os recursos existentes do Estúdio de ML (clássico).
- Consulte informações sobre projetos de machine learning em movimento de ML Studio (clássico) para Azure Machine Learning.
- Saiba mais sobre Azure Machine Learning.
A documentação do Estúdio de ML (clássico) está a ser descontinuada e poderá não ser atualizada no futuro.
Cria um modelo de classificação binária de máquina de ponto bayes
Categoria: Machine Learning / Modelo de Inicialização / Classificação
Nota
Aplica-se a: Machine Learning Studio (clássico) apenas
Módulos semelhantes de arrasto e queda estão disponíveis em Azure Machine Learning designer.
Visão geral do módulo
Este artigo descreve como usar o módulo de duas classes Bayes Point Machine em Machine Learning Studio (clássico), para criar um modelo de classificação binária destreinada.
O algoritmo neste módulo usa uma abordagem bayesiana à classificação linear chamada "Bayes Point Machine". Este algoritmo aproxima-se eficientemente da média bayesiana teoricamente ideal de classificadores lineares (em termos de desempenho de generalização) ao escolher um classificador "médio", o Bayes Point. Como a Máquina de Bayes Point é um modelo de classificação bayesiano, não é propenso a adaptar-se aos dados de treino.
Para mais informações, consulte a publicação de Chris Bishop no blog microsoft Machine Learning: Abraçar a Incerteza - Inferência Probabilística.
Como configurar Two-Class Máquina de Pontos de Bayes
Em Machine Learning Studio (clássico), adicione o módulo de duas classes Bayes Point Machine à sua experiência. Pode encontrar o módulo em Machine Learning, Modelo Inicialize, Classificação.
Para o Número de iterações de treino, escreva um número para especificar com que frequência o algoritmo que passa a mensagem itera sobre os dados de treino. Normalmente, o número de iterações deve ser definido para um valor na gama 5 - 100.
Quanto maior for o número de iterações de treino, mais precisas são as previsões; no entanto, o treino será mais lento.
Para a maioria dos conjuntos de dados, a definição padrão de 30 iterações de treino é suficiente para que o algoritmo faça previsões precisas. Por vezes, previsões precisas podem ser feitas usando menos iterações. Para conjuntos de dados com funcionalidades altamente correlacionadas, poderá beneficiar de mais iterações de treino.
Selecione a opção, Inclua o preconceito, se pretender que uma funcionalidade ou viés constante seja adicionado a cada instância no treino e na previsão.
A inclusão de um enviesamento é necessária quando os dados já não contêm uma característica constante.
Selecione a opção, Permita valores desconhecidos em funcionalidades categóricas, para criar um grupo para valores desconhecidos.
Se desmarcar esta opção, o modelo só pode aceitar os valores contidos nos dados de treino.
Se selecionar esta opção e permitir valores desconhecidos, o modelo poderá ser menos preciso para valores conhecidos, mas pode fornecer melhores previsões para novos valores (desconhecidos).
Adicione uma instância do módulo Train Model e os seus dados de treino.
Ligação os dados de formação e a saída do módulo de máquina de dois bayes point para o módulo Modelo de Comboio, e escolha a coluna de etiqueta.
Execute a experimentação.
Resultados
Após o treino estar completo, clique à direita na saída do módulo Modelo de Comboio para ver os resultados:
Para ver um resumo dos parâmetros do modelo, juntamente com os pesos de recurso aprendidos com o treino, selecione Visualize.
Para guardar o modelo para utilização posterior, clique com o botão direito na saída do Comboio MOdel e selecione Save as Train Model.
Para fazer previsões, utilize o modelo treinado como entrada para o módulo 'Modelo de Pontuação '.
O modelo não treinado também pode ser passado para o Modelo Cross-Validate para validação cruzada contra um conjunto de dados rotulado.
Exemplos
Para ver como a máquina de Two-Class Bayes Point é usada na aprendizagem automática, veja estas experiências de amostra na Galeria Azure AI:
- Compare os Classificadores Binários: Esta amostra demonstra a utilização de vários classificadores de duas classes.
Notas técnicas
Esta secção contém detalhes de implementação e perguntas frequentes sobre este algoritmo.
Detalhes da pesquisa original e teoria subjacente estão disponíveis neste artigo (PDF): Bayes Point Machines, por Herbert, Graepe e Campbell
No entanto, esta implementação melhora o algoritmo original de várias formas:
Usa o algoritmo de propagação da expectativa. Para mais informações, consulte uma família de algoritmos para obter inferência bayesiana aproximada.
Não é necessária uma varredura de parâmetros.
Este método não requer que os dados sejam normalizados.
Estas melhorias tornam o modelo de classificação da Máquina de Pontos bayes mais robusto e mais fácil de usar, e pode contornar o passo demorado da afinação dos parâmetros.
Parâmetros do módulo
Nome | Intervalo | Tipo | Predefinição | Description |
---|---|---|---|---|
Número de iterações de formação | >=1 | Número inteiro | 30 | Especificar o número de iterações a utilizar durante o treino |
Incluir preconceito | Qualquer | Booleano | Verdadeiro | Indicar se uma característica ou viés constante deve ser adicionado a cada instância |
Permitir valores desconhecidos em características categóricas | Qualquer | Booleano | Verdadeiro | Se verdadeiro, cria um nível adicional para cada coluna categórica. Quaisquer níveis no conjunto de dados de teste que não estejam disponíveis no conjunto de dados de formação são mapeados para este nível adicional. |
Saída
Nome | Tipo | Description |
---|---|---|
Modelo destreinado | Interface ILearner | Um modelo de classificação binária destreinada |