Transformação de Dados – Processamento
Importante
O suporte para o Machine Learning Studio (clássico) terminará em 31 de agosto de 2024. É recomendável fazer a transição para o Azure Machine Learning até essa data.
A partir de 1º de dezembro de 2021, você não poderá criar recursos do Machine Learning Studio (clássico). Até 31 de agosto de 2024, você pode continuar usando os recursos existentes do Machine Learning Studio (clássico).
- Confira informações sobre como mover projetos de machine learning do ML Studio (clássico) para o Azure Machine Learning.
- Saiba mais sobre o Azure Machine Learning.
A documentação do ML Studio (clássico) está sendo desativada e pode não ser atualizada no futuro.
este artigo descreve os módulos no Machine Learning Studio (clássico) que você pode usar para a manipulação de dados básica.
Observação
aplica-se a: somente Machine Learning Studio (clássico)
Módulos semelhantes do tipo "arrastar e soltar" estão disponíveis no designer do Azure Machine Learning.
o Machine Learning Studio (clássico) dá suporte a tarefas específicas para aprendizado de máquina, como normalização ou seleção de recursos. Os módulos nesta categoria destinam-se a tarefas mais gerais.
Tarefas de manipulação de dados
os módulos nesta categoria destinam-se a dar suporte a tarefas de gerenciamento de dados principais que talvez precisem ser executadas no Machine Learning Studio (clássico). As seguintes tarefas são exemplos de tarefas de gerenciamento de dados principais:
- Combine dois conjuntos de registros, seja usando junções ou mesclando colunas ou linhas.
- Crie novas categorias a serem usadas no agrupamento de dados.
- Modifique os títulos de coluna, altere os tipos de dados da coluna ou as colunas de sinalizador como recursos ou rótulos.
- Verifique se há valores ausentes e substitua-os pelos valores apropriados.
Tarefas relacionadas
- Executar amostragem ou dividir um conjunto de dados em conjuntos de treinamento e teste: Use os módulos transformação de dados – exemplo e divisão .
- Dimensionar números, normalizar dados ou colocar valores numéricos em compartimentos: Use os módulos transformação de dados – escala e redução .
- Executar cálculos em campos de dados numéricos ou para gerar estatísticas comumente usadas: Use as ferramentas em funções estatísticas.
Exemplos
Para obter exemplos de como trabalhar com dados complexos em experimentos de aprendizado de máquina, consulte estes exemplos no Galeria de ia do Azure:
- Processamento e análise de dados: demonstra as principais ferramentas e processos.
- Detecção de câncer mama: ilustra como particionar conjuntos de os e, em seguida, aplicar processamento especial a cada partição.
Módulos nesta categoria
A categoria Data Transformation-Manipulation inclui os seguintes módulos:
- Adicionar colunas: Adiciona um conjunto de colunas de um conjunto de um para outro.
- Adicionar linhas: acrescenta um conjunto de linhas de um conjunto de dados de entrada para o final de outro conjunto.
- aplicar SQL transformação: executa uma consulta do SQLite em conjuntos de dados de entrada para transformar os dados.
- Limpar dados ausentes: especifica como tratar valores que estão ausentes de um DataSet. Esse módulo substitui o scrubbing de valores ausentes, que foi preterido.
- Converter em valores de indicador: converte valores categóricos em colunas para valores de indicador.
- Editar metadados: edita os metadados associados às colunas em um conjunto de uma.
- Agrupar valores categóricos: agrupa dados de várias categorias em uma nova categoria.
- Dados de junção: une dois conjuntos.
- Remover linhas duplicadas: remove linhas duplicadas de um DataSet.
- Selecionar colunas no conjunto de conjuntos: seleciona as colunas a serem incluídas em um conjunto de um ou excluir de um conjunto de uma operação.
- Selecionar colunas de transformação: cria uma transformação que seleciona o mesmo subconjunto de colunas como em um conjunto de uma especificado.
- SMOTE: aumenta o número de exemplos de baixa incidência em um conjunto de um DataSet usando sobreamostragem minoritária sintética.