Partilhar via


Componente do modelo de comboio

Este artigo descreve um componente no designer do Azure Machine Learning.

Use este componente para treinar um modelo de classificação ou regressão. O treinamento ocorre depois de definir um modelo e seus parâmetros, e requer dados marcados. Você também pode usar Train Model para treinar novamente um modelo existente com novos dados.

Como funciona o processo de formação

No Azure Machine Learning, criar e usar um modelo de aprendizado de máquina normalmente é um processo de três etapas.

  1. Você configura um modelo, escolhendo um tipo específico de algoritmo e definindo seus parâmetros ou hiperparâmetros. Escolha qualquer um dos seguintes tipos de modelo:

    • Modelos de classificação , baseados em redes neurais, árvores de decisão, florestas de decisão e outros algoritmos.
    • Modelos de regressão , que podem incluir regressão linear padrão, ou que usam outros algoritmos, incluindo redes neurais e regressão bayesiana.
  2. Forneça um conjunto de dados rotulado e com dados compatíveis com o algoritmo. Conecte os dados e o modelo ao Train Model.

    O que a formação produz é um formato binário específico, o iLearner, que encapsula os padrões estatísticos aprendidos a partir dos dados. Não é possível modificar ou ler diretamente este formato; no entanto, outros componentes podem usar esse modelo treinado.

    Você também pode exibir as propriedades do modelo. Para obter mais informações, consulte a seção Resultados.

  3. Após a conclusão do treinamento, use o modelo treinado com um dos componentes de pontuação, para fazer previsões sobre novos dados.

Como usar o modelo de trem

  1. Adicione o componente Modelo de trem ao pipeline. Você pode encontrar esse componente na categoria Aprendizado de Máquina. Expanda Trem e arraste o componente Modelo de trem para o pipeline.

  2. Na entrada esquerda, anexe o modo não treinado. Anexe o conjunto de dados de treinamento à entrada à direita do Modelo de Trem.

    O conjunto de dados de treinamento deve conter uma coluna de rótulo. Todas as linhas sem rótulos são ignoradas.

  3. Para a coluna Rótulo, clique em Editar coluna no painel direito do componente e escolha uma única coluna que contenha os resultados que o modelo pode usar para treinamento.

    • Para problemas de classificação, a coluna do rótulo deve conter valores categóricos ou valores discretos . Alguns exemplos podem ser uma classificação sim/não, um código ou nome de classificação de doença ou um grupo de rendimentos. Se você escolher uma coluna não categórica, o componente retornará um erro durante o treinamento.

    • Para problemas de regressão, a coluna de rótulo deve conter dados numéricos que representam a variável de resposta. Idealmente, os dados numéricos representam uma escala contínua.

    Exemplos podem ser uma pontuação de risco de crédito, o tempo projetado para falha para um disco rígido ou o número previsto de chamadas para um call center em um determinado dia ou horário. Se você não escolher uma coluna numérica, poderá receber um erro.

    • Se você não especificar qual coluna de rótulo usar, o Aprendizado de Máquina do Azure tentará inferir qual é a coluna de rótulo apropriada, usando os metadados do conjunto de dados. Se ele escolher a coluna errada, use o seletor de coluna para corrigi-la.

    Gorjeta

    Se você tiver problemas para usar o Seletor de Colunas, consulte o artigo Selecionar Colunas no Conjunto de Dados para obter dicas. Ele descreve alguns cenários comuns e dicas para usar as opções WITH RULES e BY NAME .

  4. Envie o pipeline. Se você tiver muitos dados, pode demorar um pouco.

    Importante

    Se você tiver uma coluna ID que é a ID de cada linha, ou uma coluna de texto, que contém muitos valores exclusivos, Train Model pode atingir um erro como "Número de valores exclusivos na coluna: "{column_name}" é maior do que o permitido.

    Isso ocorre porque a coluna atingiu o limite de valores exclusivos e pode causar falta de memória. Você pode usar Editar metadados para marcar essa coluna como recurso Limpar e ela não será usada no treinamento ou Extrair recursos de N-Gram do componente Texto para pré-processar a coluna de texto. Consulte Código de erro do Designer para obter mais detalhes do erro.

Interpretabilidade do modelo

A interpretabilidade do modelo oferece a possibilidade de compreender o modelo de ML e apresentar a base subjacente para a tomada de decisão de uma forma que seja compreensível para os seres humanos.

Atualmente, o componente Train Model suporta o uso do pacote de interpretabilidade para explicar modelos de ML. Os seguintes algoritmos incorporados são suportados:

  • Regressão Linear
  • Regressão da Rede Neural
  • Regressão da árvore de decisão impulsionada
  • Regressão da Floresta de Decisão
  • Regressão de Poisson
  • Regressão Logística de Duas Classes
  • Máquina de Vetores de Suporte de Duas Classes
  • Árvore de Decisão Impulsionada de Duas Classes
  • Floresta de Decisão de Duas Classes
  • Floresta de Decisão Multiclasse
  • Regressão Logística Multiclasse
  • Rede Neural Multiclasse

Para gerar explicações do modelo, você pode selecionar True na lista suspensa de Explicação do modelo no componente Train Model. Por padrão, ele é definido como False no componente Train Model . Por favor, note que a geração de explicação requer um custo de computação extra.

Captura de ecrã a mostrar a caixa de verificação de explicação do modelo

Após a conclusão da execução do pipeline, você pode visitar a guia Explicações no painel direito do componente Train Model e explorar o desempenho do modelo, o conjunto de dados e a importância do recurso.

Captura de ecrã a mostrar gráficos de explicação do modelo

Para saber mais sobre como usar explicações de modelo no Aprendizado de Máquina do Azure, consulte o artigo de instruções sobre Interpretar modelos de ML.

Resultados

Após o modelo ser treinado:

  • Para usar o modelo em outros pipelines, selecione o componente e selecione o ícone Registrar conjunto de dados na guia Saídas no painel direito. Você pode acessar modelos salvos na paleta de componentes em Conjuntos de dados.

  • Para usar o modelo na previsão de novos valores, conecte-o ao componente Modelo de pontuação , juntamente com novos dados de entrada.

Próximos passos

Consulte o conjunto de componentes disponíveis para o Azure Machine Learning.