Machine Learning - Comboio
Importante
O suporte para o Estúdio de ML (clássico) terminará a 31 de agosto de 2024. Recomendamos a transição para o Azure Machine Learning até essa data.
A partir de 1 de dezembro de 2021, não poderá criar novos recursos do Estúdio de ML (clássico). Até 31 de agosto de 2024, pode continuar a utilizar os recursos existentes do Estúdio de ML (clássico).
- Consulte informações sobre projetos de machine learning em movimento de ML Studio (clássico) para Azure Machine Learning.
- Saiba mais sobre Azure Machine Learning.
A documentação do Estúdio de ML (clássico) está a ser descontinuada e poderá não ser atualizada no futuro.
Este artigo descreve os módulos fornecidos no Machine Learning Studio (clássico) para a formação de um modelo de machine learning. A formação é o processo de análise de dados de entrada utilizando os parâmetros de um modelo predefinido. A partir desta análise, o modelo aprende os padrões e guarda-os na forma de um modelo treinado.
Nota
Aplica-se a: Machine Learning Studio (clássico) apenas
Módulos semelhantes de arrasto e queda estão disponíveis em Azure Machine Learning designer.
Este artigo também descreve o processo geral em Machine Learning Studio (clássico) para criação de modelos, formação, avaliação e pontuação.
Criar e utilizar modelos de aprendizagem automática
O fluxo de trabalho típico para machine learning inclui estas fases:
- Escolher um algoritmo adequado e definir opções iniciais.
- Treinar o modelo em dados compatíveis.
- Criar previsões utilizando novos dados, com base nos padrões do modelo.
- Avaliar o modelo para determinar se as previsões são precisas, quanto erro existe e se há alguma sobremontagem.
Machine Learning Studio (clássico) suporta uma estrutura flexível e personalizável para machine learning. Cada tarefa neste processo é realizada por um tipo específico de módulo, que pode ser modificado, adicionado ou removido, sem quebrar o resto da sua experiência.
Os módulos desta categoria apoiam a formação para diferentes tipos de modelos. Durante o treino, os dados são analisados pelo algoritmo de aprendizagem automática. Este algoritmo analisa a distribuição e o tipo de dados, compila estatísticas e cria padrões que podem ser usados posteriormente para previsão.
Mais sobre formação de modelos
Quando Machine Learning está a treinar um modelo, as filas com valores em falta são ignoradas. Portanto, se pretender fixar os valores manualmente, utilizar a imputação ou especificar um método diferente para manusear valores em falta, utilize o módulo de Dados Desaparecidos Limpos antes de treinar no conjunto de dados.
Recomendamos que utilize o módulo Editar Metadados para corrigir quaisquer outros problemas com os dados. Pode ser necessário marcar a coluna do rótulo, alterar tipos de dados ou corrigir nomes de colunas.
Para outras tarefas comuns de limpeza de dados, tais como normalização, amostragem, vinculamento e escala, consulte a categoria de Transformação de Dados .
Escolha o treinador certo
O método que usa para treinar um modelo depende do tipo de modelo que está a criar e do tipo de dados que o modelo necessita. Por exemplo, Machine Learning fornece módulos especificamente para modelos de deteção de anomalias de formação, modelos de recomendação, e muito mais.
Verifique a lista de módulos de treino para determinar qual deles está correto para o seu cenário.
Se não tiver a certeza dos melhores parâmetros a utilizar ao treinar um modelo, utilize um dos módulos previstos para a varredura e validação de parâmetros:
Tune Model Hyperparameters pode executar uma varredura de parâmetros em quase todos os modelos de classificação e regressão. Treina vários modelos e depois devolve o melhor modelo.
O módulo de Agrupamento sweep suporta afinação de modelos durante o processo de treino, e destina-se a ser utilizado apenas com modelos de agrupamento. Pode especificar uma gama de centrosids e treinar dados enquanto deteta automaticamente os melhores parâmetros.
O módulo Modelo Cross-Valide também é útil para a otimização do modelo, mas não devolve um modelo treinado. Em vez disso, fornece métricas que pode usar para determinar o melhor modelo.
Reenviar modelos
Se precisar de reconverter um modelo de produção, pode voltar a executar a experiência a qualquer momento.
Também pode automatizar o processo de reconversão utilizando serviços web. Para uma passagem, consulte retreinando e atualizando Machine Learning modelos com a Azure Data Factory.
Utilize modelos pré-treinados
Machine Learning inclui alguns modelos pré-treinados, como o módulo de Classificação de Imagem em Cascata pré-treinado. Pode utilizar estes modelos para pontuar sem entrada de dados adicionais.
Além disso, alguns módulos (como a Deteção de Anomalias em Séries de Tempo) não geram um modelo treinado no formato iLearner. Mas pegam em dados de formação e criam um modelo internamente, que pode ser usado para fazer previsões. Para usá-los, basta configurar os parâmetros e fornecer dados.
Guarde uma foto de um modelo treinado
Se quiser guardar ou exportar o modelo, clique com o botão direito no módulo de treino e selecione Save as Training Model. O modelo é exportado para o formato iLearner e guardado no seu espaço de trabalho, em Modelos Treinados. Os modelos treinados podem ser reutilizados noutras experiências ou ligados a outros módulos para pontuação.
Também pode utilizar o módulo Modelo Treinado de Carga numa experiência para recuperar um modelo armazenado.
Lista de módulos
A categoria Comboio inclui estes módulos:
- Varrer o clustering: Executa uma varredura de parâmetros num modelo de agrupamento para determinar as definições de parâmetros ideais e treina o melhor modelo.
- Modelo de deteção de anomalias de comboio: Treina um modelo de detetor de anomalias e rotula dados de um conjunto de treino.
- Modelo de Agrupamento de Comboios: Treina um modelo de agrupamento e atribui dados do conjunto de formação a clusters.
- Train Matchbox Recommender: Treina um recomendador Bayesiano utilizando o algoritmo Matchbox.
- Modelo de comboio: Treina um modelo de classificação ou regressão a partir de um conjunto de treino.
- Sintonizar hiperparmetros: Executa uma varredura de parâmetros num modelo de regressão ou classificação para determinar as definições ideais dos parâmetros e treina o melhor modelo.
Tarefas relacionadas
Alguns módulos não estão nesta categoria, pois requerem um formato especial ou são personalizados para uma tarefa específica:
- Preparar Modelo de Deteção de Anomalias
- Trem Vowpal Wabbit Versão 7-4
- Versão wabbit 5-10 do comboio Vowpal
- Comboio Vowpal Wabbit Versão 8
- Alocação Latente de Dirichlet