Transformação de dados
Importante
O suporte para o Machine Learning Studio (clássico) terminará em 31 de agosto de 2024. É recomendável fazer a transição para o Azure Machine Learning até essa data.
A partir de 1º de dezembro de 2021, você não poderá criar recursos do Machine Learning Studio (clássico). Até 31 de agosto de 2024, você pode continuar usando os recursos existentes do Machine Learning Studio (clássico).
- Confira informações sobre como mover projetos de machine learning do ML Studio (clássico) para o Azure Machine Learning.
- Saiba mais sobre o Azure Machine Learning.
A documentação do ML Studio (clássico) está sendo desativada e pode não ser atualizada no futuro.
este artigo lista os módulos fornecidos no Machine Learning Studio (clássico) para transformação de dados. Para o aprendizado de máquina, a transformação de dados envolve algumas tarefas muito gerais, como a junção de conjuntos ou a alteração de nomes de colunas. Mas também inclui muitas tarefas que são específicas para o aprendizado de máquina, como normalização, compartimentalização e agrupamento, e inferência de valores ausentes.
Observação
aplica-se a: somente Machine Learning Studio (clássico)
Módulos semelhantes do tipo "arrastar e soltar" estão disponíveis no designer do Azure Machine Learning.
Importante
os dados que você usa no Machine Learning Studio (clássico) geralmente devem ser "organizados" antes de você importá-los para o Machine Learning Studio (clássico). A preparação de dados pode incluir, por exemplo, garantir que os dados usem a codificação correta e verificar se os dados têm um esquema consistente.
Os módulos para transformação de dados são agrupados nas seguintes categorias baseadas em tarefas:
- Criando filtros para processamento de sinal digital: filtros de sinal digital podem ser aplicados a dados numéricos para dar suporte a tarefas de aprendizado de máquina, como reconhecimento de imagem, reconhecimento de voz e análise de forma de onda.
- Gerando e usando recursos baseados em contagem: os módulos personalização baseados em contagem ajudam você a desenvolver recursos do Compact para usar no aprendizado de máquina.
- Manipulação e preparação de dados gerais: mesclar conjuntos de dados, limpar valores ausentes, agrupar e resumir dados, alterar nomes de coluna e tipos de dado, ou indicar qual coluna é um rótulo ou um recurso.
- Amostragem e divisão de conjuntosde dados: divida seus dados em conjuntos de treinamento e teste, divida os conjuntos de dados por porcentagem ou por uma condição de filtro ou execute a amostragem.
- Dimensionando e reduzindo dados: preparar dados numéricos para análise aplicando a normalização ou dimensionando. Dados de compartimento em grupos, remover ou substituir exceções ou executar análise de componente principal (PCA).
Lista de módulos
As categorias de módulo a seguir estão incluídas na categoria de transformação de dados :
- Transformação de dados-filtro
- Aprendendo com contagens
- Transformação de Dados – Processamento
- Transformação de dados-amostra e divisão
- Transformação de dados – escala e redução