Transformação de Dados - Manipulação
Importante
O suporte para o Estúdio de ML (clássico) terminará a 31 de agosto de 2024. Recomendamos a transição para o Azure Machine Learning até essa data.
A partir de 1 de dezembro de 2021, não poderá criar novos recursos do Estúdio de ML (clássico). Até 31 de agosto de 2024, pode continuar a utilizar os recursos existentes do Estúdio de ML (clássico).
- Consulte informações sobre projetos de machine learning em movimento de ML Studio (clássico) para Azure Machine Learning.
- Saiba mais sobre Azure Machine Learning.
A documentação do Estúdio de ML (clássico) está a ser descontinuada e poderá não ser atualizada no futuro.
Este artigo descreve os módulos em Machine Learning Studio (clássico) que pode usar para manipulação básica de dados.
Nota
Aplica-se a: Machine Learning Studio (clássico) apenas
Módulos semelhantes de arrasto e queda estão disponíveis em Azure Machine Learning designer.
Machine Learning Studio (clássico) suporta tarefas específicas para machine learning, como normalização ou seleção de recursos. Os módulos desta categoria destinam-se a tarefas mais gerais.
Tarefas de manipulação de dados
Os módulos desta categoria destinam-se a suportar tarefas fundamentais de gestão de dados que possam ter de ser executadas no Machine Learning Studio (clássico). As seguintes tarefas são exemplos de tarefas fundamentais de gestão de dados:
- Combine dois conjuntos de dados, quer utilizando juntas, quer através da fusão de colunas ou linhas.
- Criar novas categorias para utilizar em dados de agrupamento.
- Modifique as posições das colunas, altere os tipos de dados das colunas ou as colunas de bandeira como características ou etiquetas.
- Verifique se há valores em falta e, em seguida, substitua-os por valores apropriados.
Tarefas relacionadas
- Executar a amostragem ou dividir um conjunto de dados em conjuntos de treino e teste: Utilize os módulos de Transformação de Dados - Amostra e Divisão .
- Dimensionar os números, normalizar dados ou colocar valores numéricos em caixotes: Utilize os módulos de Transformação de Dados - Escala e Redução .
- Realizar cálculos em campos de dados numéricos ou gerar estatísticas comumente utilizadas: Utilize as ferramentas em Funções Estatísticas.
Exemplos
Por exemplo, como trabalhar com dados complexos em experiências de machine learning, consulte estas amostras na Galeria Azure AI:
- Processamento e Análise de Dados: Demonstra ferramentas e processos chave.
- Deteção do cancro da mama: Ilustra como partição conjuntos de dados e, em seguida, aplica processamento especial a cada partição.
Módulos nesta categoria
A categoria de Transformação de Dados - Manipulação inclui os seguintes módulos:
- Adicionar Colunas: Adiciona um conjunto de colunas de um conjunto de dados a outro.
- Adicionar Linhas: Apê-lo um conjunto de linhas de um conjunto de dados de entrada até ao final de outro conjunto de dados.
- Aplicar SQL Transformation: Executa uma consulta SQLite nos conjuntos de dados de entrada para transformar os dados.
- Limpar dados em falta: Especifica como lidar com valores que faltam a partir de um conjunto de dados. Este módulo substitui o Scrubber de Valores Desaparecidos, que foi depreciado.
- Converter para Valores indicadores: Converte valores categóricos em colunas para valores indicadores.
- Editar Metadados: Edita metadados associados a colunas num conjunto de dados.
- Valores Categóricos do Grupo:Grupo de dados de várias categorias para uma nova categoria.
- Junte-se a Dados: Junta dois conjuntos de dados.
- Remover Linhas Duplicadas: Remove linhas duplicadas de um conjunto de dados.
- Selecione Colunas no Conjunto de Dados: Selecione colunas para incluir num conjunto de dados ou excluir de um conjunto de dados numa operação.
- Selecione Columns Transform: Cria uma transformação que seleciona o mesmo subconjunto de colunas que num conjunto de dados especificado.
- SMOTE: Aumenta o número de exemplos de baixa incidência num conjunto de dados utilizando a sobresmaltagem sintética das minorias.