Componente do modelo de comboio
Este artigo descreve um componente no designer do Azure Machine Learning.
Use este componente para treinar um modelo de classificação ou regressão. O treinamento ocorre depois de definir um modelo e seus parâmetros, e requer dados marcados. Você também pode usar Train Model para treinar novamente um modelo existente com novos dados.
Como funciona o processo de formação
No Azure Machine Learning, criar e usar um modelo de aprendizado de máquina normalmente é um processo de três etapas.
Você configura um modelo, escolhendo um tipo específico de algoritmo e definindo seus parâmetros ou hiperparâmetros. Escolha qualquer um dos seguintes tipos de modelo:
- Modelos de classificação , baseados em redes neurais, árvores de decisão, florestas de decisão e outros algoritmos.
- Modelos de regressão , que podem incluir regressão linear padrão, ou que usam outros algoritmos, incluindo redes neurais e regressão bayesiana.
Forneça um conjunto de dados rotulado e com dados compatíveis com o algoritmo. Conecte os dados e o modelo ao Train Model.
O que a formação produz é um formato binário específico, o iLearner, que encapsula os padrões estatísticos aprendidos a partir dos dados. Não é possível modificar ou ler diretamente este formato; no entanto, outros componentes podem usar esse modelo treinado.
Você também pode exibir as propriedades do modelo. Para obter mais informações, consulte a seção Resultados.
Após a conclusão do treinamento, use o modelo treinado com um dos componentes de pontuação, para fazer previsões sobre novos dados.
Como usar o modelo de trem
Adicione o componente Modelo de trem ao pipeline. Você pode encontrar esse componente na categoria Aprendizado de Máquina. Expanda Trem e arraste o componente Modelo de trem para o pipeline.
Na entrada esquerda, anexe o modo não treinado. Anexe o conjunto de dados de treinamento à entrada à direita do Modelo de Trem.
O conjunto de dados de treinamento deve conter uma coluna de rótulo. Todas as linhas sem rótulos são ignoradas.
Para a coluna Rótulo, clique em Editar coluna no painel direito do componente e escolha uma única coluna que contenha os resultados que o modelo pode usar para treinamento.
Para problemas de classificação, a coluna do rótulo deve conter valores categóricos ou valores discretos . Alguns exemplos podem ser uma classificação sim/não, um código ou nome de classificação de doença ou um grupo de rendimentos. Se você escolher uma coluna não categórica, o componente retornará um erro durante o treinamento.
Para problemas de regressão, a coluna de rótulo deve conter dados numéricos que representam a variável de resposta. Idealmente, os dados numéricos representam uma escala contínua.
Exemplos podem ser uma pontuação de risco de crédito, o tempo projetado para falha para um disco rígido ou o número previsto de chamadas para um call center em um determinado dia ou horário. Se você não escolher uma coluna numérica, poderá receber um erro.
- Se você não especificar qual coluna de rótulo usar, o Aprendizado de Máquina do Azure tentará inferir qual é a coluna de rótulo apropriada, usando os metadados do conjunto de dados. Se ele escolher a coluna errada, use o seletor de coluna para corrigi-la.
Gorjeta
Se você tiver problemas para usar o Seletor de Colunas, consulte o artigo Selecionar Colunas no Conjunto de Dados para obter dicas. Ele descreve alguns cenários comuns e dicas para usar as opções WITH RULES e BY NAME .
Envie o pipeline. Se você tiver muitos dados, pode demorar um pouco.
Importante
Se você tiver uma coluna ID que é a ID de cada linha, ou uma coluna de texto, que contém muitos valores exclusivos, Train Model pode atingir um erro como "Número de valores exclusivos na coluna: "{column_name}" é maior do que o permitido.
Isso ocorre porque a coluna atingiu o limite de valores exclusivos e pode causar falta de memória. Você pode usar Editar metadados para marcar essa coluna como recurso Limpar e ela não será usada no treinamento ou Extrair recursos de N-Gram do componente Texto para pré-processar a coluna de texto. Consulte Código de erro do Designer para obter mais detalhes do erro.
Interpretabilidade do modelo
A interpretabilidade do modelo oferece a possibilidade de compreender o modelo de ML e apresentar a base subjacente para a tomada de decisão de uma forma que seja compreensível para os seres humanos.
Atualmente, o componente Train Model suporta o uso do pacote de interpretabilidade para explicar modelos de ML. Os seguintes algoritmos incorporados são suportados:
- Regressão Linear
- Regressão da Rede Neural
- Regressão da árvore de decisão impulsionada
- Regressão da Floresta de Decisão
- Regressão de Poisson
- Regressão Logística de Duas Classes
- Máquina de Vetores de Suporte de Duas Classes
- Árvore de Decisão Impulsionada de Duas Classes
- Floresta de Decisão de Duas Classes
- Floresta de Decisão Multiclasse
- Regressão Logística Multiclasse
- Rede Neural Multiclasse
Para gerar explicações do modelo, você pode selecionar True na lista suspensa de Explicação do modelo no componente Train Model. Por padrão, ele é definido como False no componente Train Model . Por favor, note que a geração de explicação requer um custo de computação extra.
Após a conclusão da execução do pipeline, você pode visitar a guia Explicações no painel direito do componente Train Model e explorar o desempenho do modelo, o conjunto de dados e a importância do recurso.
Para saber mais sobre como usar explicações de modelo no Aprendizado de Máquina do Azure, consulte o artigo de instruções sobre Interpretar modelos de ML.
Resultados
Após o modelo ser treinado:
Para usar o modelo em outros pipelines, selecione o componente e selecione o ícone Registrar conjunto de dados na guia Saídas no painel direito. Você pode acessar modelos salvos na paleta de componentes em Conjuntos de dados.
Para usar o modelo na previsão de novos valores, conecte-o ao componente Modelo de pontuação , juntamente com novos dados de entrada.
Próximos passos
Consulte o conjunto de componentes disponíveis para o Azure Machine Learning.