Machine Learning: puntuación
Importante
El soporte técnico de Machine Learning Studio (clásico) finalizará el 31 de agosto de 2024. Se recomienda realizar la transición a Azure Machine Learning antes de esa fecha.
A partir del 1 de diciembre de 2021 no se podrán crear recursos de Machine Learning Studio (clásico). Hasta el 31 de agosto de 2024, puede seguir usando los recursos de Machine Learning Studio (clásico) existentes.
- Consulte la información acerca de traslado de proyectos de aprendizaje automático de ML Studio (clásico) a Azure Machine Learning.
- Más información sobre Azure Machine Learning.
La documentación de ML Studio (clásico) se está retirando y es posible que no se actualice en el futuro.
En esta sección se enumeran los módulos proporcionados en Machine Learning Studio (clásico) para la puntuación.
Nota:
Solo se aplica a: Machine Learning Studio (clásico)
Hay módulos para arrastrar y colocar similares en el diseñador de Azure Machine Learning.
La puntuación también se denomina predicción y es el proceso de generar valores basados en un modelo de aprendizaje automático entrenado, dados algunos datos de entrada nuevos. Los valores o puntuaciones que se crean pueden representar predicciones de valores futuros, pero también pueden representar una categoría o un resultado probables. El significado de la puntuación depende del tipo de datos que proporcione y del tipo de modelo que haya creado.
Creación y uso de modelos en Machine Learning Studio (clásico)
El flujo de trabajo típico para el aprendizaje automático incluye estas fases:
- Elegir un algoritmo adecuado y establecer las opciones iniciales.
- Entrenamiento del modelo en datos compatibles.
- Crear predicciones mediante nuevos datos, en función de los patrones del modelo.
- Evaluar el modelo para determinar si las predicciones son precisas, cuánto error hay y si hay sobreajuste.
Machine Learning Studio (clásico) admite un marco flexible y personalizable para el aprendizaje automático. Cada tarea de este proceso se realiza mediante un tipo específico de módulo, que se puede modificar, agregar o quitar, sin dividir el resto del experimento.
Los módulos de esta sección incluyen herramientas para la puntuación. En esta fase del aprendizaje automático, se aplica un modelo entrenado a nuevos datos para generar predicciones. Puede enviar esas predicciones a una aplicación que consume resultados de aprendizaje automático o usar los resultados de la puntuación para evaluar la precisión y utilidad del modelo.
Más información sobre la puntuación
La puntuación se usa ampliamente en el aprendizaje automático para significar el proceso de generación de nuevos valores, dado un modelo y alguna entrada nueva. Se usa el término genérico "score", en lugar de "prediction", porque el proceso de puntuación puede generar tantos tipos diferentes de valores:
- Una lista de elementos recomendados y una puntuación de similitud.
- Valores numéricos para modelos de serie temporal y modelos de regresión.
- Valor de probabilidad, que indica la probabilidad de que una nueva entrada pertenezca a alguna categoría existente.
- Nombre de una categoría o clúster con el que un nuevo elemento es más similar.
- Clase o resultado predicho para los modelos de clasificación.
Nota:
Es posible que también haya oído la puntuación de palabras que se usa para significar un peso o un valor asignado como resultado del análisis de datos. Sin embargo, Machine Learning Studio (clásico), la puntuación normalmente denota el proceso de generación de valores de predicción a partir de datos nuevos.
Al agregar uno de estos módulos en el experimento, debe adjuntar un modelo de aprendizaje automático ya entrenado y algunos datos nuevos. Al ejecutar el experimento o el módulo seleccionado, el módulo de puntuación ingiere los nuevos datos, calcula las puntuaciones en función del modelo y devuelve las puntuaciones de una tabla.
Datos usados para la puntuación
Por lo general, los nuevos datos que proporcione como entrada deben tener las mismas columnas que se usaron para entrenar el modelo, menos la etiqueta o la columna de resultados.
Las columnas que se usan únicamente como identificadores normalmente se excluyen al entrenar un modelo y, por tanto, también se deben excluir al puntuar. Sin embargo, los identificadores como las claves principales se pueden volver a combinar fácilmente con el conjunto de datos de puntuación más adelante, mediante el módulo Agregar columnas. Este módulo funciona sin tener que especificar una clave de combinación, siempre y cuando el tamaño del conjunto de datos no haya cambiado.
Antes de realizar la puntuación en el conjunto de datos, compruebe siempre si faltan valores y valores NULL. Cuando faltan valores en los datos usados como entrada para la puntuación, los valores que faltan se usan como entradas. Dado que se propagan valores NULL, el resultado suele ser un valor que falta.
Lista de módulos de puntuación
Machine Learning Studio (clásico) proporciona muchos módulos de puntuación diferentes. Seleccione uno en función del tipo de modelo que use o del tipo de tarea de puntuación que realice:
Aplicar transformación: aplica una transformación de datos bien especificada a un conjunto de datos.
Use este módulo para aplicar un proceso guardado a un conjunto de datos.
Asignar datos a clústeres: asigna datos a clústeres mediante un modelo de agrupación en clústeres entrenado existente.
Use este módulo si desea crear clústeres de datos nuevos en función de un modelo de agrupación en clústeres K-Means existente.
Este módulo reemplaza el módulo Asignar a clústeres (en desuso), que ha quedado en desuso pero sigue estando disponible para su uso en experimentos existentes.
Puntuar recomendador de Matchbox: puntua las predicciones de un conjunto de datos mediante el recomendador matchbox.
Use este módulo si desea generar recomendaciones, buscar elementos o usuarios relacionados o predecir clasificaciones.
Puntuar modelo: puntua las predicciones para un modelo de clasificación o regresión entrenado.
Use este módulo para todos los demás modelos de regresión y clasificación, así como algunos modelos de detección de anomalías.
Tareas relacionadas
- Se proporcionan módulos de puntuación especiales para Vowpal Wabbit. Consulte Text Analytics.
- Puede puntuar para clases especiales de imágenes en modelos previamente entrenados mediante la biblioteca OpenCV.
- El módulo Detección de anomalías de serie temporal genera puntuaciones que representan posibles desviaciones de una tendencia.
Ejemplos
Estos ejemplos de la Azure AI Gallery muestran el proceso de puntuación, desde escenarios básicos a avanzados:
Clasificación binaria para el marketing directo: muestra el flujo de trabajo básico para la puntuación, en un escenario donde el valor previsto es la respuesta del cliente a una campaña de marketing.
Predicción de revisiones de libros: puntuación en datos de texto. Usa un modelo de regresión logística.
Learning con recuentos: muestra cómo usar la caracterización basada en recuentos para realizar predicciones.
Puntuación por lotes sin código con Logic Apps y Machine Learning: muestra el proceso de un extremo a otro de entrenamiento y puntuación, automatizado con la característica Logic Apps de Azure App Service.
En los artículos siguientes se proporcionan ejemplos reales de cómo puede usar un modelo de aprendizaje automático para la puntuación: