Módulos de machine learning ML Studio (clássico)
Importante
O suporte para o Machine Learning Studio (clássico) terminará em 31 de agosto de 2024. É recomendável fazer a transição para o Azure Machine Learning até essa data.
A partir de 1º de dezembro de 2021, você não poderá criar recursos do Machine Learning Studio (clássico). Até 31 de agosto de 2024, você pode continuar usando os recursos existentes do Machine Learning Studio (clássico).
- Confira informações sobre como mover projetos de machine learning do ML Studio (clássico) para o Azure Machine Learning.
- Saiba mais sobre o Azure Machine Learning.
A documentação do ML Studio (clássico) está sendo desativada e pode não ser atualizada no futuro.
O fluxo de trabalho típico para o aprendizado de máquina inclui várias fases:
Identificar um problema a ser resolvido e uma métrica para medir os resultados.
Localizar, limpar e preparar os dados apropriados.
Identificar os melhores recursos e engenharia de novos recursos.
Criando, avaliando e ajustando modelos.
Usando modelos para gerar previsões, recomendações e outros resultados.
Os módulos nesta seção fornecem ferramentas para as fases finais do aprendizado de máquina, nas quais você aplica um algoritmo aos dados para treinar um modelo. Nessas fases finais, você também gera pontuações e avalia a precisão e a utilidade do modelo.
Observação
Aplica-se a: Machine Learning Studio (clássico) somente
Módulos semelhantes do tipo "arrastar e soltar" estão disponíveis no designer do Azure Machine Learning.
Lista de tarefas de aprendizado de máquina por categoria
-
Escolha entre uma variedade de algoritmos de aprendizado de máquina personalizáveis, incluindo clustering, regressão, classificação e modelos de detecção de anomalias.
-
Forneça seus dados para o modelo configurado para aprender com padrões e criar estatísticas que podem ser usadas para previsões.
-
Crie previsões usando os modelos treinados.
-
Mede a precisão de um modelo treinado ou compare vários modelos.
Para ver uma descrição detalhada desse fluxo de trabalho experimental, confira o passo a passo da solução de risco de crédito.
Pré-requisitos
Antes de chegar à parte divertida da criação de um modelo, normalmente é necessária muita preparação. Esta seção fornece links para ferramentas no Machine Learning Studio (clássico) que podem ajudá-lo a limpar seus dados, melhorar a qualidade da entrada e evitar erros em tempo de run-time.
Exploração de dados e qualidade de dados
Verifique se os dados são o tipo certo de dados, a quantidade certa e a qualidade certa para o algoritmo escolhido. Entenda quantos dados você tem e como eles são distribuídos. Há exceções? Como eles foram gerados e o que significam? Existem registros duplicados?
Manipular valores ausentes
Valores ausentes podem afetar os resultados de várias maneiras. Por exemplo, quase todos os métodos estatísticos descartam casos com valores ausentes. Por padrão, Machine Learning segue estas regras quando encontra linhas com valores ausentes:
Se os dados usados para treinar o modelo têm valores ausentes, as linhas com valores ausentes são ignoradas.
Se os dados usados como entrada quando a pontuação em um modelo tiver valores ausentes, os valores ausentes serão usados como entradas, mas nulos serão propagados. Isso geralmente significa que um nulo é inserido nos resultados em vez de uma previsão válida.
Verifique seus dados antes de treinar seu modelo. Para imputar os valores ausentes ou corrigir seus dados, use este módulo:
Selecionar recursos e reduzir a dimensionalidade
Machine Learning Studio (clássico) pode ajudá-lo a passar pelos dados para encontrar os atributos mais úteis.
Use ferramentas como Análise discriminatória linear de linear ou seleção de recursos com base em filtro para determinar quais colunas de dados têm o poder mais preditivo. Essas ferramentas também podem identificar colunas que devem ser removidas devido a vazamento de dados.
Crie ou projete recursos de dados existentes. Normalize dados ouagrupar dados em compartimentos para fazer novos grupos de dados ou padronizar o intervalo de valores numéricos antes da análise.
Reduza a dimensionalidade agrupando valores categóricos, usando a análise de componente principal ou por amostragem.
Exemplos
Para ver exemplos de aprendizado de máquina em ação, consulte o Galeria de IA do Azure.
Para dicas e um passo a passo de algumas tarefas típicas de preparação de dados, consulte Passo a passo executando o Processo de Ciência de Dados de Equipe.