Módulos de aprendizaje automático en ML Studio (clásico)
Importante
El soporte técnico de Machine Learning Studio (clásico) finalizará el 31 de agosto de 2024. Se recomienda realizar la transición a Azure Machine Learning antes de esa fecha.
A partir del 1 de diciembre de 2021 no se podrán crear recursos de Machine Learning Studio (clásico). Hasta el 31 de agosto de 2024, puede seguir usando los recursos de Machine Learning Studio (clásico) existentes.
- Consulte la información acerca de traslado de proyectos de aprendizaje automático de ML Studio (clásico) a Azure Machine Learning.
- Más información sobre Azure Machine Learning.
La documentación de ML Studio (clásico) se está retirando y es posible que no se actualice en el futuro.
El flujo de trabajo típico para el aprendizaje automático incluye muchas fases:
Identificar un problema que se va a resolver y una métrica para medir los resultados.
Buscar, limpiar y preparar los datos adecuados.
Identificar las mejores características e ingeniería de nuevas características.
Compilar, evaluar y optimizar modelos.
Usar modelos para generar predicciones, recomendaciones y otros resultados.
Los módulos de esta sección proporcionan herramientas para las fases finales del aprendizaje automático, en las que se aplica un algoritmo a los datos para entrenar un modelo. En estas fases finales, también se generan puntuaciones y, a continuación, se evalúa la precisión y utilidad del modelo.
Nota:
Solo se aplica a: Machine Learning Studio (clásico)
Hay módulos para arrastrar y colocar similares en el diseñador de Azure Machine Learning.
Lista de tareas de aprendizaje automático por categoría
-
Elija entre una variedad de algoritmos de aprendizaje automático personalizables, incluidos los modelos de agrupación en clústeres, regresión, clasificacióny detección de anomalías.
-
Proporcione los datos al modelo configurado para aprender de los patrones y crear estadísticas que se puedan usar para las predicciones.
-
Cree predicciones mediante los modelos entrenados.
-
Mida la precisión de un modelo entrenado o compare varios modelos.
Para obtener una descripción detallada de este flujo de trabajo experimental, consulte el tutorial de la solución de riesgo de crédito.
Prerrequisitos
Para poder llegar a la parte divertida de la creación de un modelo, normalmente se requiere mucha preparación. En esta sección se proporcionan vínculos a herramientas de Machine Learning Studio (clásico) que pueden ayudarle a limpiar los datos, mejorar la calidad de la entrada y evitar errores en tiempo de ejecución.
Exploración de datos y calidad de datos
Asegúrese de que los datos son el tipo de datos correcto, la cantidad adecuada y la calidad adecuada para el algoritmo que ha elegido. Comprenda cuántos datos tiene y cómo se distribuyen. ¿Existen valores atípicos? ¿Cómo se generaron y qué significan? ¿Existen registros duplicados?
Controlar los valores que faltan
Los valores que faltan pueden afectar a los resultados de muchas maneras. Por ejemplo, casi todos los métodos estadísticos descartan casos con valores que faltan. De forma predeterminada, Machine Learning sigue estas reglas cuando encuentra filas con valores que faltan:
Si los datos utilizados para entrenar un modelo tienen valores que faltan, se omiten las filas con valores que faltan.
Si faltan valores en los datos usados como entrada al puntuar en un modelo, los valores que faltan se usan como entradas, pero se propagan los valores NULL. Esto suele significar que se inserta un valor NULL en los resultados en lugar de una predicción válida.
Asegúrese de comprobar los datos antes de entrenar el modelo. Para imputar los valores que faltan o corregir los datos, use este módulo:
- Clean Missing Data (limpiar datos faltantes)
Selección de características y reducción de la dimensionalidad
Machine Learning Studio (clásico) puede ayudarle a realizar un análisis de los datos para encontrar los atributos más útiles.
Use herramientas como Linear Discriminant Analysis oFilter Based Feature Selection para determinar qué columnas de datos tienen la mayor capacidad predictiva. Estas herramientas también pueden identificar las columnas que se deben quitar debido a la pérdida de datos.
Cree o diseñe características a partir de los datos existentes. Normalice los datos o agrupa los datos en cubos para crear nuevas agrupaciones de datos o normalice el intervalo de valores numéricos antes del análisis.
Reduzca la dimensionalidad mediante la agrupación de valores categóricos, mediante el análisis de componentes principales o el muestreo.
Ejemplos
Para obtener ejemplos de aprendizaje automático en acción, consulte el Azure AI Gallery.
Para obtener sugerencias y un tutorial de algunas tareas típicas de preparación de datos, consulte Tutoriales que ejecutan el proceso de ciencia de datos en equipo.