Transformação de Dados
Importante
O suporte para o Estúdio de ML (clássico) terminará a 31 de agosto de 2024. Recomendamos a transição para o Azure Machine Learning até essa data.
A partir de 1 de dezembro de 2021, não poderá criar novos recursos do Estúdio de ML (clássico). Até 31 de agosto de 2024, pode continuar a utilizar os recursos existentes do Estúdio de ML (clássico).
- Consulte informações sobre projetos de machine learning em movimento de ML Studio (clássico) para Azure Machine Learning.
- Saiba mais sobre Azure Machine Learning.
A documentação do Estúdio de ML (clássico) está a ser descontinuada e poderá não ser atualizada no futuro.
Este artigo lista os módulos fornecidos no Machine Learning Studio (clássico) para a transformação de dados. Para a aprendizagem automática, a transformação de dados implica algumas tarefas muito gerais, tais como a junção de conjuntos de dados ou a alteração de nomes de colunas. Mas também inclui muitas tarefas específicas para o machine learning, como a normalização, o binário e o agrupamento, e a inferência dos valores em falta.
Nota
Aplica-se a: Machine Learning Studio (clássico) apenas
Módulos semelhantes de arrasto e queda estão disponíveis em Azure Machine Learning designer.
Importante
Os dados que utiliza no Machine Learning Studio (clássico) geralmente são esperados para serem "arrumados" antes de o importar para Machine Learning Studio (clássico). A preparação de dados pode incluir, por exemplo, garantir que os dados utilizam a codificação correta e verificando se os dados têm um esquema consistente.
Os módulos para a transformação de dados são agrupados nas seguintes categorias baseadas em tarefas:
- Criação de filtros para o processamento de sinais digitais: Os filtros de sinal digital podem ser aplicados a dados numéricos para suportar tarefas de aprendizagem automática, tais como reconhecimento de imagem, reconhecimento de voz e análise de formas de onda.
- Gerar e utilizar funcionalidades baseadas na contagem: Os módulos de exibição baseados no conde ajudam-no a desenvolver funcionalidades compactas para usar na aprendizagem automática.
- Manipulação e preparação geral de dados: Fusão de conjuntos de dados, limpeza de valores em falta, agrupamento e resumo de dados, alteração de nomes de colunas e tipos de dados, ou indicando qual coluna é um rótulo ou uma característica.
- Amostragem e divisão de conjuntos de dados: Divida os seus dados em conjuntos de treino e teste, divida conjuntos de dados por percentagem ou por uma condição de filtro, ou efetue a amostragem.
- Dimensionamento e redução de dados: Preparar dados numéricos para análise aplicando normalização ou por escala. Bin dados em grupos, remover ou substituir outliers, ou realizar a análise principal de componentes (APC).
Lista de módulos
As seguintes categorias de módulos estão incluídas na categoria de Transformação de Dados :
- Transformação de Dados - Filtro
- Aprendizagem com Condes
- Transformação de Dados - Manipulação
- Transformação de Dados - Amostra e Divisão
- Transformação de Dados - Escala e Redução