Componente da máquina vetorial de suporte de duas classes
Este artigo descreve um componente no designer do Azure Machine Learning.
Use este componente para criar um modelo baseado no algoritmo de máquina vetorial de suporte.
As máquinas vetoriais de suporte (SVMs) são uma classe bem pesquisada de métodos de aprendizagem supervisionada. Esta implementação em particular é adequada para a previsão de dois resultados possíveis, com base em variáveis contínuas ou categóricas.
Depois de definir os parâmetros do modelo, treine o modelo usando os componentes de treinamento e fornecendo um conjunto de dados marcado que inclua um rótulo ou uma coluna de resultado.
Sobre máquinas vetoriais de suporte
As máquinas vetoriais de suporte estão entre os primeiros algoritmos de aprendizado de máquina, e os modelos SVM têm sido usados em muitas aplicações, desde a recuperação de informações até a classificação de texto e imagem. As SVMs podem ser usadas para tarefas de classificação e regressão.
Este modelo SVM é um modelo de aprendizagem supervisionada que requer dados rotulados. No processo de treinamento, o algoritmo analisa dados de entrada e reconhece padrões em um espaço de feição multidimensional chamado hiperplano. Todos os exemplos de entrada são representados como pontos neste espaço e são mapeados para categorias de saída de tal forma que as categorias são divididas por uma lacuna tão ampla e clara quanto possível.
Para previsão, o algoritmo SVM atribui novos exemplos em uma categoria ou outra, mapeando-os nesse mesmo espaço.
Como configurar
Para esse tipo de modelo, é recomendável normalizar o conjunto de dados antes de usá-lo para treinar o classificador.
Adicione o componente Máquina vetorial de suporte de duas classes ao seu pipeline.
Especifique como deseja que o modelo seja treinado, definindo a opção Criar modo de treinador.
Parâmetro único: Se você souber como deseja configurar o modelo, poderá fornecer um conjunto específico de valores como argumentos.
Intervalo de parâmetros: Se você não tiver certeza dos melhores parâmetros, poderá encontrar os parâmetros ideais usando o componente Tune Model Hyperparameters . Você fornece algum intervalo de valores e o treinador itera em várias combinações das configurações para determinar a combinação de valores que produz o melhor resultado.
Em Número de iterações, digite um número que denote o número de iterações usadas ao criar o modelo.
Este parâmetro pode ser usado para controlar o trade-off entre velocidade de treinamento e precisão.
Para Lambda, digite um valor a ser usado como peso para regularização L1.
Este coeficiente de regularização pode ser usado para ajustar o modelo. Valores maiores penalizam modelos mais complexos.
Selecione a opção, Normalizar recursos, se quiser normalizar recursos antes do treinamento.
Se você aplicar a normalização, antes do treinamento, os pontos de dados serão centralizados na média e dimensionados para ter uma unidade de desvio padrão.
Selecione a opção, Projetar para a esfera da unidade, para normalizar os coeficientes.
Projetar valores para o espaço unitário significa que, antes do treinamento, os pontos de dados são centralizados em 0 e dimensionados para ter uma unidade de desvio padrão.
Em Semente de número aleatório, digite um valor inteiro para usar como semente se quiser garantir a reprodutibilidade entre execuções. Caso contrário, um valor de relógio do sistema é usado como uma semente, o que pode resultar em resultados ligeiramente diferentes entre as execuções.
Conecte um conjunto de dados rotulado e treine o modelo:
Se você definir Create trainer mode como Single Parameter, conecte um conjunto de dados marcado e o componente Train Model .
Se você definir Criar modo de treinamento como Intervalo de parâmetros, conecte um conjunto de dados marcado e treine o modelo usando Ajustar hiperparâmetros do modelo.
Nota
Se você passar um intervalo de parâmetros para Train Model, ele usará apenas o valor padrão na lista de parâmetros únicos.
Se você passar um único conjunto de valores de parâmetro para o componente Ajustar Hiperparâmetros do Modelo, quando ele espera um intervalo de configurações para cada parâmetro, ele ignora os valores e usa os valores padrão para o aluno.
Se você selecionar a opção Intervalo de parâmetros e inserir um único valor para qualquer parâmetro, esse único valor especificado será usado durante toda a varredura, mesmo que outros parâmetros sejam alterados em um intervalo de valores.
Envie o pipeline.
Resultados
Após a conclusão da formação:
Para salvar um instantâneo do modelo treinado, selecione a guia Saídas no painel direito do componente Modelo de trem . Selecione o ícone Registrar conjunto de dados para salvar o modelo como um componente reutilizável.
Para usar o modelo para pontuação, adicione o componente Modelo de pontuação a um pipeline.
Próximos passos
Consulte o conjunto de componentes disponíveis para o Azure Machine Learning.