Compartir a través de


SystemGetAccuracyResults (Analysis Services - Minería de datos)

Devuelve métricas de precisión de validación cruzada para una estructura de minería de datos y todos los modelos relacionados, excluidos los modelos de agrupación en clústeres.

Este procedimiento almacenado devuelve métricas para todo el conjunto de datos como una partición única. Para particionar el conjunto de datos en secciones transversales y devolver métricas para cada partición, use SystemGetCrossValidationResults (Analysis Services - Minería de datos).

[!NOTA]

Este procedimiento almacenado no se admite para los modelos generados mediante el algoritmo de serie temporal de Microsoft o el algoritmo de clústeres de secuencia de Microsoft. Asimismo, para los modelos de agrupación en clústeres, use el procedimiento almacenado independiente SystemGetClusterAccuracyResults (Analysis Services - Minería de datos).

Sintaxis

SystemGetAccuracyResults(<mining structure>, 
[,<mining model list>]
,<data set>
,<target attribute>
[,<target state>]
[,<target threshold>]
[,<test list>])

Argumentos

  • mining structure
    Nombre de una estructura de minería de datos de la base de datos actual.

    (Obligatorio)

  • model list
    Lista separada por comas de los modelos que van a validarse.

    El valor predeterminado es null. Esto significa que se usan todos los modelos aplicables. Cuando se usa el valor predeterminado, los modelos de agrupación en clústeres se excluyen automáticamente de la lista de candidatos para el procesamiento.

    (Opcional)

  • data set
    Valor entero que indica la partición de la estructura de minería de datos que se utiliza para realizar pruebas. El valor se deriva de una máscara de bits que representa la suma de los valores siguientes, donde cualquier valor individual es opcional:

    Casos de entrenamiento

    0x0001

    Casos de prueba

    0x0002

    Filtro de modelos

    0x0004

    Para obtener una lista completa de los valores posibles, vea la sección Notas de este tema.

    (Obligatorio)

  • target attribute
    Cadena que contiene el nombre de un objeto de predicción. Un objeto de predicción puede ser una columna, una columna de tabla anidada o una columna de clave de tabla anidada de un modelo de minería de datos.

    (Obligatorio)

  • target state
    Cadena que contiene un valor específico que va a predecirse.

    Si se especifica un valor, se recopilan las métricas para ese estado específico.

    Si no se especifica ningún valor, o se especifica null, se calculan las métricas del estado más probable para cada predicción.

    El valor predeterminado es null.

    (Opcional)

  • target threshold
    Número comprendido entre 0,0 y 1 que especifica la probabilidad mínima en la que el valor de predicción se considera correcto.

    El valor predeterminado es null, que significa que todas las predicciones se consideran correctas.

    (Opcional)

  • test list
    Cadena que especifica las opciones de prueba. Este parámetro se reserva para un uso futuro.

    (Opcional)

Tipo devuelto

El conjunto de filas que se devuelve incluye puntuaciones para cada partición y agregados para todos los modelos.

En la tabla siguiente se muestran las columnas que devuelve GetValidationResults.

Nombre de la columna

Descripción

Model

Nombre del modelo probado. Todos indica que el resultado es un agregado para todos los modelos.

AttributeName

Nombre de la columna de predicción.

AttributeState

Valor de destino de la columna de predicción.

Si esta columna contiene un valor, sólo se recopilan las métricas para el estado especificado.

Si no se especifica este valor, o es null, se calculan las métricas del estado más probable para cada predicción.

PartitionIndex

Indica la partición a la que se aplica el resultado.

Para este procedimiento, siempre es 0.

PartitionCases

Entero que indica el número de filas del conjunto de casos, basado en el parámetro <data set>.

Test

Tipo de prueba realizada.

Measure

Nombre de la medida que devuelve la prueba. Las medidas de cada modelo dependen del tipo de modelo y del tipo del valor de predicción.

Para obtener una lista de las medidas que se devuelven para cada tipo de predicción, vea Informe de validación cruzada (Analysis Services - Minería de datos).

Para obtener una definición de cada medida, vea Validación cruzada (Analysis Services - Minería de datos).

Value

Valor de la medida especificada.

Notas

En la tabla siguiente se proporcionan ejemplos de los valores que puede usar para especificar los datos de la estructura de minería de datos que se usan para la validación cruzada. Si desea usar casos de prueba para la validación cruzada, la estructura de minería de datos ya debe incluir un conjunto de datos de prueba. Para obtener información sobre la forma de definir un conjunto de datos de prueba al crear una estructura de minería de datos, vea Crear particiones de los datos en conjuntos de entrenamiento y de pruebas (Analysis Services - Minería de datos).

Valor entero

Descripción

1

Sólo se usan casos de entrenamiento.

2

Sólo se usan casos de prueba.

3

Se usan casos de entrenamiento y de prueba.

4

Combinación no válida.

5

Sólo se usan casos de entrenamiento y se aplica el filtro de modelos.

6

Sólo se usan casos de prueba y se aplica el filtro de modelos.

7

Se usan casos de entrenamiento y de prueba y se aplica el filtro de modelos.

Para obtener más información sobre los escenarios en los que debería utilizarse la validación cruzada, vea Validar modelos de minería de datos (Analysis Services - Minería de datos).

Ejemplos

En este ejemplo se devuelven medidas de precisión para un único modelo de árbol de decisión, v Target Mail DT, asociado a la estructura de minería de datos vTargetMail. El código de la línea cuatro indica que los resultados deben basarse en los casos de prueba, filtrados para cada modelo con el filtro específico de dicho modelo. [Bike Buyer] especifica la columna que va a predecirse, y el 1 que aparece en la línea siguiente indica que el modelo sólo va a evaluarse para el valor específico 1, que significa que sí comprará.

La línea final del código especifica que el valor del umbral de estado es 0,5. Esto significa que las predicciones que tienen una probabilidad superior al 50 por ciento deben considerarse predicciones "buenas" a la hora de calcular la precisión.

CALL SystemGetAccuracyResults (
[vTargetMail],
[vTargetMail DT],
6,
'Bike Buyer',
1,
0.5
)

Resultados del ejemplo:

ModelName

AttributeName

AttributeState

PartitionIndex

PartitionSize

Test

Measure

Value

v Target Mail DT

Bike Buyer

1

0

1638

Clasificación

Verdadero positivo

605

v Target Mail DT

Bike Buyer

1

0

1638

Clasificación

Falso positivo

177

v Target Mail DT

Bike Buyer

1

0

1638

Clasificación

Verdadero negativo

501

v Target Mail DT

Bike Buyer

1

0

1638

Clasificación

Falso negativo

355

v Target Mail DT

Bike Buyer

1

0

1638

Probabilidad

Logaritmo

-0.598454638753028

v Target Mail DT

Bike Buyer

1

0

1638

Probabilidad

Mejora respecto al modelo predictivo

0.0936717116894395

v Target Mail DT

Bike Buyer

1

0

1638

Probabilidad

Error cuadrático medio

0.361630800104946

Requisitos

La validación cruzada sólo está disponible en SQL Server 2008 Enterprise.