Compartir a través de


Probar la exactitud con gráficos de mejora respecto al modelo predictivo (Tutorial básico de minería de datos)

En la pestaña Gráfico de precisión de minería de datos del Designer de minería de datos, puede calcular el nivel en que cada uno de los modelos realiza predicciones y comparar los resultados de cada modelo directamente con los resultados de los otros modelos. Este método de comparación se conoce como gráfico de elevación. Normalmente, la exactitud de la predicción de un modelo de minería de datos se cuantifica mediante la mejora respecto al modelo predictivo o la exactitud de la clasificación. En este tutorial utilizaremos solamente el gráfico de mejora respecto al modelo predictivo.

En este tema, realizará las tareas siguientes:

Elección de los datos de entrada

El primer paso a la hora de probar la precisión de los modelos de minería de datos consiste en seleccionar el origen de datos que usará para realizar las pruebas. Probará la exactitud de los modelos con sus datos de prueba y, a continuación, los utilizará con datos externos.

Para seleccionar el conjunto de datos

  1. Cambie a la pestaña Gráfico de precisión de minería de datos de Designer en SQL Server Data Tools (SSDT) y seleccione la pestaña Selección de entrada.

  2. En el cuadro de grupo Seleccionar un conjunto de datos para usarlo en un gráfico de precisión , seleccione Usar casos de prueba de estructura de minería de datos. Estos son los datos de prueba que separó cuando creó la estructura de minería de datos.

    Para obtener más información sobre las otras opciones, vea Elegir un tipo de gráfico de precisión y establecer opciones de gráfico.

Establecer parámetros de gráfico de precisión

Para crear un gráfico de precisión, debe definir tres cosas:

  • ¿Qué modelos debe incluir en el gráfico de precisión?

  • ¿Qué atributo de predicción desea medir? Algunos modelos pueden tener varios objetivos, pero cada gráfico solo puede medir un resultado cada vez.

    Para usar una columna como nombre de columna predecible en un gráfico de precisión, las columnas deben tener el tipo de uso de Predict o Predict Only. Además, el tipo de contenido de la columna de destino debe ser Discrete o Discretized. Es decir, no puede medir la precisión en salidas numéricas continuas con el gráfico de elevación.

  • ¿Desea medir la precisión general del modelo o su precisión para predecir un valor determinado (como [Bike Buyer] = 'Sí')

Para generar el gráfico de elevación

  1. En la pestaña Selección de entrada del Diseñador de minería de datos, en Seleccione las columnas del modelo de minería de datos de predicción que se mostrarán en el gráfico de elevación, active la casilla correspondiente a Sincronizar valores y columnas de predicción.

  2. En la columna Nombre de columna de predicción , compruebe que Bike Buyer está seleccionado para cada modelo.

  3. En la columna Mostrar , seleccione cada uno de los modelos.

    De forma predeterminada, todos los modelos de la estructura de minería de datos aparecen seleccionados. Puede decidir no incluir un modelo específico, pero para este tutorial deje todos los modelos seleccionados.

  4. En la columna Valor de predicción , seleccione 1. El mismo valor se rellena automáticamente para cada modelo que tiene la misma columna de predicción.

  5. Seleccione la pestaña Gráfico de elevación .

    Al hacer clic en la pestaña, se ejecuta una consulta de predicción para obtener predicciones de los datos de prueba, y se comparan los resultados con los valores conocidos. Los resultados se trazan en el gráfico.

    Si especificó un resultado de destino determinado mediante la opción Predecir valor , el gráfico de elevación traza los resultados de las estimaciones aleatorias y los resultados de un modelo ideal.

    • La línea de suposición aleatoria muestra cuál sería el grado de precisión del modelo sin utilizar ningún dato para informar de sus predicciones: es decir, una división 50-50 entre dos resultados. El gráfico de elevación ayuda a visualizar la mejora del funcionamiento del modelo con respecto a una estimación aleatoria.

    • La línea del modelo ideal representa el límite superior de precisión. Muestra el beneficio máximo posible que podría conseguir si el modelo siempre hiciera sus predicciones con precisión.

    Los modelos de minería de datos que creó estarán normalmente entre estos dos extremos. Cualquier mejora de la estimación aleatoria se considera lift.

  6. Utilice la leyenda para buscar las líneas coloreadas que representan el modelo ideal y el modelo de suposición aleatoria.

    Observará que el TM_Decision_Tree modelo proporciona la mejor elevación, superando los modelos clustering y Naive Bayes.

Para obtener una explicación detallada de un gráfico de elevación similar al creado en esta lección, consulte Lift Chart (Analysis Services - Minería de datos).

Siguiente tarea de la lección

Probar un modelo filtrado (Tutorial básico de minería de datos)

Consulte también

Gráfico de mejora respecto al modelo predictivo (Analysis Services - Minería de datos)
Pestaña Gráfico de elevación (vista Gráfico de precisión de minería de datos)