Transformación de datos: escalado y reducción
Importante
El soporte técnico de Machine Learning Studio (clásico) finalizará el 31 de agosto de 2024. Se recomienda realizar la transición a Azure Machine Learning antes de esa fecha.
A partir del 1 de diciembre de 2021 no se podrán crear recursos de Machine Learning Studio (clásico). Hasta el 31 de agosto de 2024, puede seguir usando los recursos de Machine Learning Studio (clásico) existentes.
- Consulte la información acerca de traslado de proyectos de aprendizaje automático de ML Studio (clásico) a Azure Machine Learning.
- Más información sobre Azure Machine Learning.
La documentación de ML Studio (clásico) se está retirando y es posible que no se actualice en el futuro.
En este artículo se describen los módulos de Machine Learning Studio (clásico) que pueden ayudarle a trabajar con datos numéricos. En el caso del aprendizaje automático, las tareas de datos comunes incluyen el recorte, la binning y la normalización de valores numéricos. Otros módulos admiten la reducción de dimensionalidad.
Nota:
Solo se aplica a: Machine Learning Studio (clásico)
Hay módulos para arrastrar y colocar similares en el diseñador de Azure Machine Learning.
Modelado de datos numéricos
Tareas como normalizar, binning o redistribuir variables numéricas son una parte importante de la preparación de los datos para el aprendizaje automático. Los módulos de este grupo admiten las siguientes tareas de preparación de datos:
- Agrupación de datos en cubos de diferentes tamaños o distribuciones.
- Quitar valores atípicos o cambiar sus valores.
- Normalizar un conjunto de valores numéricos en un intervalo específico.
- Crear un conjunto compacto de columnas de características a partir de un conjunto de datos de gran dimensión.
Tareas relacionadas
- Seleccione las características pertinentes y útiles que se usarán en la creación del modelo: use los módulos Selección de características o Análisis discriminante lineal de Linear Linear.
- Seleccionar características basadas en recuentos de valores: use el módulo Learning con recuentos.
- Quitar o reemplazar los valores que faltan: use el módulo Limpiar datos que faltan .
- Reemplazar valores categóricos por valores numéricos derivados de cálculos: use el módulo Reemplazar valores discretos .
- Calcular una distribución de probabilidad para columnas discretas o numéricas: use el módulo Evaluar función de probabilidad .
- Filtrar y transformar señales digitales y formas de onda: use el módulo Filtro .
Lista de módulos
Esta categoría Transformación de datos: escala y reducción incluye los módulos siguientes:
- Valores de recorte: detecta valores atípicos y, a continuación, recorta o reemplaza sus valores.
- Agrupar datos en cubos: coloca datos numéricos en cubos.
- Normalizar datos: vuelve a escalar los datos numéricos para restringir los valores del conjunto de datos a un intervalo estándar.
- Análisis de componentes principales: calcula un conjunto de características que tienen una dimensionalidad reducida para un aprendizaje más eficaz.