Herramientas de gráficos de precisión de modelos (Analysis Services - Minería de datos)
La ficha Gráfico de precisión de minería de datos, que está disponible tanto en SQL Server Management Studio como en Business Intelligence Development Studio, proporciona varias herramientas que sirven para validar los modelos de minería de datos:
Todos los gráficos de elevación, gráficos de beneficios y gráficos de dispersión se pueden ver en la ficha Gráfico de elevación. Utilice la ficha Selección de entrada para elegir un modelo y establecer opciones, y a continuación haga clic en la ficha Gráfico de elevación y seleccione el tipo de gráfico que desee en la lista Tipo de gráfico. Se muestra un gráfico de dispersión automáticamente si el modelo representa una regresión lineal.
Las matrices de clasificación, denominadas en ocasiones tablas de confusión, se pueden configurar en la ficha Selección de entrada y, a continuación, mostrarse en la ficha Matriz de clasificación.
Los informes de validación cruzada se pueden configurar y ver en la ficha Validación cruzada de la ficha Gráfico de precisión de minería de datos.
[!NOTA]
La ficha Gráfico de precisión de minería de datos no se puede utilizar con modelos de serie temporal.
Gráfico de elevación
Un gráfico de elevación representa los resultados de las consultas de predicción de un conjunto de datos de prueba en función de valores conocidos de la columna de predicción que existe en el conjunto de datos. El gráfico muestra los resultados del modelo de minería de datos, junto con una representación de los resultados que generaría un modelo ideal, así como una representación de los resultados de previsión aleatoria. Cualquier mejora por encima de la línea aleatoria se denomina mejora respecto al modelo predictivo. Cuanta más elevación muestre el modelo, más efectivo es. En un gráfico de elevación, sólo pueden compararse los modelos de minería de datos que contienen atributos de predicción.
Puede crear un gráfico de elevación utilizando la ficha Selección de entrada para configurar el modelo de destino y elegir un conjunto de datos de prueba. A continuación, haga clic en la ficha Gráfico de elevación para ver el gráfico completado.
Para obtener más información: Gráfico de elevación (Analysis Services - Minería de datos), Temas de procedimientos de la ficha Gráfico de precisión de minería de datos, Herramientas de gráficos de precisión de modelos (Analysis Services - Minería de datos)
Gráfico de beneficios
Un gráfico de beneficios es una variante del gráfico de elevación que integra información sobre el costo empresarial de la utilización de las predicciones generadas por un modelo. Después de escribir los hechos relacionados con los costos, como por ejemplo los cargos por envío, Analysis Services muestra una curva que representa la mejora respecto al modelo predictivo que proporciona el modelo y también calcula las ganancias de la inversión cuando se utiliza el modelo.
Puede crear un gráfico de beneficios utilizando la ficha Selección de entrada para configurar el modelo de destino y elegir un conjunto de datos de prueba. A continuación, haga clic en la ficha Gráfico de elevación y seleccione Gráfico de beneficios en la lista Tipo de gráfico. El cuadro de diálogo Configuración del gráfico de beneficios se abre automáticamente. Después de configurar los parámetros únicos de los gráficos de beneficios, el gráfico que se muestra en la ficha Gráfico de precisión de minería de datos cambia automáticamente para mostrar las pérdidas y ganancias por unidad.
Para obtener más información: Gráfico de beneficios (Analysis Services - Minería de datos), Configuración del gráfico de beneficios (cuadro de diálogo de la vista Gráfico de precisión de minería de datos)
Gráfico de dispersión
Un gráfico de dispersión representa la precisión de un modelo que predice un atributo continuo, comparando los valores reales con los valores previstos para cada caso. Se generará un gráfico de dispersión en lugar de un gráfico de elevación siempre que los atributos de predicción tengan valores continuos.
Si el modelo admite la columna de predicción y las columnas de entrada necesarias, se puede crear un gráfico de dispersión en la ficha Gráfico de precisión de minería de datos del Diseñador de minería de datos. En primer lugar, use la ficha Selección de entrada para configurar el modelo de destino y elegir un conjunto de datos de prueba. A continuación, haga clic en la ficha Gráfico de elevación. El gráfico que se muestra en la ficha Gráfico de precisión de minería de datos cambia automáticamente para mostrar un grafo que presenta la relación lineal entre las entradas y los valores previstos.
Para obtener más información: Gráfico de dispersión (Analysis Services - Minería de datos)
Matriz de clasificación
Una matriz de clasificación es otro modo de examinar la precisión con que los modelos de minería de datos de una estructura crean predicciones. Para generar una matriz de clasificación, Analysis Services cuenta el número de predicciones buenas y erróneas, utilizando los valores reales existentes en el conjunto de datos de prueba. La matriz es una herramienta valiosa porque no sólo muestra la frecuencia con que el modelo predice un valor correctamente, sino que también muestra qué valores predice incorrectamente. Una matriz de clasificación muestra el recuento real de verdaderos positivos, falsos positivos, verdaderos negativos y falsos negativos para cada atributo de predicción.
Puede crear una matriz de clasificación en la ficha Gráfico de precisión de minería de datos del Diseñador de minería de datos. En primer lugar, use la ficha Selección de entrada para configurar el modelo de destino y elegir un conjunto de datos de prueba. A continuación, haga clic en la ficha Matriz de clasificación. Se muestra el gráfico automáticamente, sin que sea necesaria ninguna otra configuración.
Para obtener más información:Matriz de clasificación (Analysis Services - Minería de datos), Temas de procedimientos de la ficha Gráfico de precisión de minería de datos, Herramientas de gráficos de precisión de modelos (Analysis Services - Minería de datos)
Informe de validación cruzada
La validación cruzada es una técnica avanzada de minería de datos que ayuda a medir la validez de un modelo. Al crear un informe de validación cruzada, Analysis Services divide el conjunto de datos en varias secciones transversales, crea y entrena automáticamente varios modelos en los subconjuntos y, a continuación, calcula la precisión de todos los modelos. Si revisa las estadísticas que se generan, puede evaluar hasta qué punto un modelo se generaliza bien para diferentes conjuntos de datos, o determinar cuál de los diversos modelos de una estructura se comporta mejor.
Puede crear un informe de validación cruzada en la ficha Gráfico de precisión de minería de datos del Diseñador de minería de datos seleccionando un modelo o estructura, y utilizando a continuación la ficha Validación cruzada para establecer las opciones para el número de subconjuntos, el atributo de destino, etcétera.
Para obtener más información: Validación cruzada (Analysis Services - Minería de datos), Informe de validación cruzada (Analysis Services - Minería de datos)