Transformação de Dados - Escala e Redução
Importante
O suporte para o Estúdio de ML (clássico) terminará a 31 de agosto de 2024. Recomendamos a transição para o Azure Machine Learning até essa data.
A partir de 1 de dezembro de 2021, não poderá criar novos recursos do Estúdio de ML (clássico). Até 31 de agosto de 2024, pode continuar a utilizar os recursos existentes do Estúdio de ML (clássico).
- Consulte informações sobre projetos de machine learning em movimento de ML Studio (clássico) para Azure Machine Learning.
- Saiba mais sobre Azure Machine Learning.
A documentação do Estúdio de ML (clássico) está a ser descontinuada e poderá não ser atualizada no futuro.
Este artigo descreve os módulos em Machine Learning Studio (clássico) que podem ajudá-lo a trabalhar com dados numéricos. Para o machine learning, as tarefas comuns de dados incluem recortes, binning e valores numéricos normalizadores. Outros módulos suportam a redução da dimensionalidade.
Nota
Aplica-se a: Machine Learning Studio (clássico) apenas
Módulos semelhantes de arrasto e queda estão disponíveis em Azure Machine Learning designer.
Modelação de dados numéricos
Tarefas como normalizar, ligar ou redistribuir variáveis numéricas são uma parte importante da preparação de dados para a aprendizagem automática. Os módulos deste grupo suportam as seguintes tarefas de preparação de dados:
- Agrupar dados em caixotes de diferentes tamanhos ou distribuição.
- Remoção de outliers ou alteração dos seus valores.
- Normalizar um conjunto de valores numéricos num intervalo específico.
- Criar um conjunto compacto de colunas de recurso a partir de um conjunto de dados de alta dimensão.
Tarefas relacionadas
- Selecione funcionalidades relevantes e úteis para utilizar na construção do modelo: Utilize os módulos de Seleção de Recursos ou Análise Discriminatória Linear de Fisher .
- Selecione funcionalidades com base nas contagens dos valores: Utilize o Aprendizagem com o módulo Counts.
- Remova ou substitua os valores em falta: Utilize o módulo de dados em falta .
- Substitua valores categóricos por valores numéricos derivados de cálculos: Utilize o módulo Valores Discretos de Substituição .
- Calcular uma distribuição de probabilidade para colunas discretas ou numéricas: Utilize o módulo de Função de Probabilidade de Avaliação .
- Filtrar e transformar sinais digitais e formas de onda: Utilize o módulo Filtro .
Lista de módulos
Esta categoria de Transformação de Dados - Escala e Redução inclui os seguintes módulos:
- Valores do clipe: Deteta os outliers e, em seguida, corta ou substitui os seus valores.
- Dados de grupo em caixotes: Coloca dados numéricos em caixotes.
- Normalizar dados: Reescala os dados numéricos para limitar os valores do conjunto de dados a uma gama padrão.
- Análise principal de componentes: Calcula um conjunto de funcionalidades que reduziram a dimensionalidade para uma aprendizagem mais eficiente.