Módulos de machine learning em ML Módulos (clássicos) do Estúdio
Importante
O suporte para o Estúdio de ML (clássico) terminará a 31 de agosto de 2024. Recomendamos a transição para o Azure Machine Learning até essa data.
A partir de 1 de dezembro de 2021, não poderá criar novos recursos do Estúdio de ML (clássico). Até 31 de agosto de 2024, pode continuar a utilizar os recursos existentes do Estúdio de ML (clássico).
- Consulte informações sobre projetos de machine learning em movimento de ML Studio (clássico) para Azure Machine Learning.
- Saiba mais sobre Azure Machine Learning.
A documentação do Estúdio de ML (clássico) está a ser descontinuada e poderá não ser atualizada no futuro.
O fluxo de trabalho típico para machine learning inclui muitas fases:
Identificar um problema para resolver e uma métrica para medir resultados.
Encontrar, limpar e preparar dados apropriados.
Identificar as melhores características e criar novas funcionalidades.
Construir, avaliar e afinar modelos.
Usando modelos para gerar previsões, recomendações e outros resultados.
Os módulos desta secção fornecem ferramentas para as fases finais do machine learning, em que se aplica um algoritmo aos dados para treinar um modelo. Nestas fases finais, também gera pontuações e, em seguida, avalia a precisão e utilidade do modelo.
Nota
Aplica-se a: Machine Learning Studio (clássico) apenas
Módulos semelhantes de arrasto e queda estão disponíveis em Azure Machine Learning designer.
Lista de tarefas de aprendizagem automática por categoria
-
Escolha entre uma variedade de algoritmos de aprendizagem automática personalizáveis, incluindo clustering, regressão, classificação e modelos de deteção de anomalias .
-
Forneça os seus dados ao modelo configurado para aprender com padrões e criar estatísticas que possam ser usadas para previsões.
-
Criar previsões utilizando os modelos treinados.
-
Meça a precisão de um modelo treinado ou compare vários modelos.
Para uma descrição detalhada deste fluxo de trabalho experimental, consulte a solução de risco de crédito.
Pré-requisitos
Antes de chegar à parte divertida da construção de um modelo, normalmente é necessária muita preparação. Esta secção fornece links para ferramentas no Machine Learning Studio (clássico) que podem ajudá-lo a limpar os seus dados, melhorar a qualidade de entrada e prevenir erros de tempo de execução.
Exploração de dados e qualidade de dados
Certifique-se de que os seus dados são o tipo certo de dados, a quantidade certa e a qualidade certa para o algoritmo que escolheu. Compreenda a quantidade de dados que tem e como é distribuído. Existem forasteiros? Como foram gerados, e o que significam? Há algum registo duplicado?
Lidar com valores em falta
Os valores em falta podem afetar os seus resultados de muitas maneiras. Por exemplo, quase todos os métodos estatísticos descartam casos com valores em falta. Por defeito, Machine Learning segue estas regras quando encontra linhas com valores em falta:
Se os dados utilizados para treinar um modelo utilizadores de valores em falta, quaisquer linhas com valores em falta são ignoradas.
Se os dados utilizados como entrada ao marcar contra um modelo utilizadores têm valores em falta, os valores em falta são utilizados como entradas, mas os nulos são propagados. Isto geralmente significa que um nulo é inserido nos resultados em vez de uma previsão válida.
Certifique-se de verificar os seus dados antes de treinar o seu modelo. Para imputar os valores em falta ou corrigir os seus dados, utilize este módulo:
Selecione funcionalidades e reduza a dimensionalidade
Machine Learning Studio (clássico) pode ajudá-lo a vasculhar os seus dados para encontrar os atributos mais úteis.
Utilize ferramentas como Fisher Linear Discriminant Analysis ou Filter Based Feature Selection para determinar quais as colunas de dados com a potência mais preditiva. Estas ferramentas também podem identificar colunas que devem ser removidas devido a fugas de dados.
Criar ou criar funcionalidades a partir de dados existentes. Normalize dados ou dados de grupo em caixotes para fazer novos agrupamentos de dados, ou normalize a gama de valores numéricos antes da análise.
Reduzir a dimensionalidade agrupondo valores categóricos, utilizando a análise principal dos componentes, ou por amostragem.
Exemplos
Por exemplo, a aprendizagem automática em ação, consulte a Galeria Azure AI.
Para obter dicas, e uma passagem de algumas tarefas típicas de pré-preparação de dados, consulte Walkthroughs executando o Processo de Ciência de Dados de Equipa.