Compartir a través de


Explorar los modelos Market Basket (tutorial intermedio de minería de datos)

Después de crear el modelo Association, puede explorarlo con el visor de asociación de Microsoft, que se encuentra en la ficha Visor de modelos de minería de datos del Diseñador de minería de datos. Este tutorial le guía a través del uso del visor para explorar las relaciones entre los elementos. El visor le ayuda a saber de un vistazo qué productos tienden a aparecer juntos y a obtener una idea general de los patrones que surgen.

El Visor de asociación de Microsoft contiene tres fichas: Conjuntos de elementos, Reglas y Red de dependencias. Dado que cada ficha revela una vista ligeramente diferente de los datos, cuando explore un modelo, normalmente alternará entre los diferentes paneles varias veces mientras obtiene más detalles.

  • Ficha Red de dependencias

  • Ficha Conjuntos de elementos

  • Ficha Reglas

  • Visor de árbol de contenido genérico

En este tutorial, comenzará en la ficha Red de dependencias y, a continuación, utilizará la ficha Reglas y la ficha Conjuntos de elementos para profundizar en el conocimiento de las relaciones que se revelan en el visor. También utilizará el Visor de árbol de contenido genérico de Microsoft para recuperar estadísticas detalladas de reglas individuales o conjuntos de elementos.

Ficha Red de dependencias

Mediante la ficha Red de dependencias, puede examinar la interacción entre los diferentes elementos del modelo. Cada nodo del visor representa un elemento mientras que las líneas entre ellos representan las relaciones. Al seleccionar un nodo, puede ver qué otros nodos predicen el elemento seleccionado o qué elementos predice el elemento actual. En algunos casos, hay una asociación bidireccional entre elementos, lo que significa que aparecen a menudo en la misma transacción. Puede hacer referencia a la leyenda de color de la parte inferior de la ficha para determinar la dirección de la asociación.

Una línea que conecta dos elementos significa que es probable que aparezcan juntos en una transacción. En otras palabras, es probable que los clientes compren estos elementos conjuntamente. El control deslizante se asocia con la probabilidad de una regla. Mueva el control deslizante arriba o abajo para filtrar las asociaciones débiles, lo que significa que las reglas tienen una probabilidad baja.

El gráfico de red de dependencias muestra las reglas por parejas, lo que se puede representar lógicamente como A->B y significa que, si se compra el producto A, es probable que se compre después el producto B. El gráfico no puede mostrar reglas del tipo AB->C. Si mueve el control deslizante para mostrar todas las reglas pero sigue sin ver ninguna línea en el gráfico, significa que no hubo ninguna pareja de reglas que cumplieran los criterios de los parámetros del algoritmo.

También puede buscar los nodos por nombre, escribiendo las primeras letras del nombre de atributo. Para obtener más información, vea Buscar nodo (cuadro de diálogo de la vista del Visor de modelos de minería de datos).

Para abrir el modo de asociación en el Visor de reglas de asociación de Microsoft

  1. En el Explorador de soluciones, haga doble clic en la estructura Asociación.

  2. En el Diseñador de minería de datos, haga clic en la ficha Visor de modelo de minería de datos.

  3. Seleccione Asociación en la lista de modelos de minería de datos, en la lista desplegable Modelo de minería de datos.

Para navegar por el gráfico de dependencias y buscar nodos concretos

  1. En la ficha Visor de modelo de minería de datos, haga clic en la ficha Red de dependencias.

  2. Haga clic en Acercar varias veces, hasta que pueda ver con facilidad las etiquetas de cada nodo.

    De forma predeterminada, el gráfico se muestra con todos los nodos visibles. En un modelo complejo, puede haber muchos nodos, con lo que cada nodo es bastante pequeño.

  3. Haga clic en el signo + en la esquina inferior derecha del visor y mantenga presionado el botón del mouse para obtener una vista ampliada del gráfico.

  4. En el lado izquierdo del visor, arrastre hacia abajo el control deslizante, moviéndolo de Todos los vínculos (el valor predeterminado) a la parte inferior del control deslizante.

  5. El visor actualiza el gráfico para que ahora sólo muestre la asociación más fuerte, entre los elementos Touring Tire y Touring Tire Tube.

  6. Haga clic en el nodo con la etiqueta Touring Tire Tube = Existing.

    El gráfico se actualiza para resaltar únicamente los elementos que están muy relacionados con este elemento. Observe la dirección de la flecha entre los dos elementos.

  7. En el lado izquierdo del visor, arrastre el control deslizante hacia arriba de nuevo, moviéndolo desde la parte inferior aproximadamente hasta el medio.

    Tenga en cuenta los cambios de la flecha que conecta los dos elementos.

  8. Seleccione Mostrar sólo el nombre de atributo en la lista desplegable de la parte superior del panel Red de dependencias.

    Las etiquetas de texto del gráfico se actualizan para mostrar sólo el nombre del modelo.

Volver al principio

Ficha Conjuntos de elementos

Luego, obtendrá más información sobre las reglas y conjuntos de elementos generados por el modelo para los productos Touring Tire Tube y Touring Tire. La ficha Conjuntos de elementos muestra tres extractos de información importantes relacionados con los conjuntos de elementos que el algoritmo de asociación de Microsoft detecta:

  • **Compatibilidad:    **el número de transacciones en las que se produce el conjunto de elementos.

  • **Tamaño:    **el número de elementos que se encuentran en el conjunto de elementos.

  • **Elementos:    **una lista de los elementos incluidos en cada conjunto de elementos.

Dependiendo de cómo se configuren los parámetros del algoritmo, éste podría generar muchos conjuntos de elementos. Cada conjunto de elementos que se devuelve en el visor representa las transacciones en las que se vendió el elemento. Mediante los controles situados en la parte superior de la ficha Conjuntos de elementos, puede filtrar el visor para que muestre sólo los conjuntos de elementos que tengan un tamaño y un soporte mínimo específicos.

Si está trabajando con un modelo de minería de datos diferente y no aparece ningún conjunto de elementos, se debe a que ninguno cumplió los criterios de los parámetros del algoritmo. En este tipo de escenario, puede cambiar los parámetros del algoritmo para permitir conjuntos de elementos que tengan una compatibilidad más baja.

Para filtrar por nombre los conjuntos de elementos que se muestran en el visor

  1. Haga clic en la ficha Conjuntos de elementos del visor.

  2. En el cuadro Filtrar conjunto de elementos, escriba Touring Tire y, a continuación, haga clic fuera del cuadro.

    El filtro devuelve todos los elementos que contienen esta cadena.

  3. En la lista Mostrar, seleccione Mostrar sólo el nombre del atributo.

  4. Active la casilla Mostrar nombre largo.

    La lista de conjuntos de elementos se actualiza para mostrar sólo los conjuntos de elementos que contienen la cadena Touring Tire. El nombre largo del conjunto de elementos incluye el nombre de la tabla que contiene el atributo y el valor de cada elemento.

  5. Desactive la casilla Mostrar nombre largo.

    La lista de conjuntos de elementos se actualiza para mostrar sólo el nombre corto.

Los valores de la columna Compatibilidad indican el número de transacciones para cada conjunto de elementos. Una transacción para un conjunto de elementos significa una compra que incluía todos los elementos del conjunto de elementos.

De forma predeterminada, el visor muestra en orden descendente los conjuntos de elementos por compatibilidad. Puede hacer clic en los encabezados de columna para ordenar por una columna diferente, por ejemplo por el tamaño del conjunto de elementos o el nombre. Si le interesa obtener más información sobre las transacciones individuales que están incluidas en un conjunto de elementos, puede obtener detalles de los casos individuales en los conjuntos de elementos. Las columnas de estructura de los resultados de la obtención de detalles son el nivel de ingresos del cliente y su identificador, que no se usaron en el modelo.

Para ver los detalles de un conjunto de elementos

  1. En la lista de conjuntos de elementos, haga clic en el encabezado de columna Conjunto de elementos para ordenar por nombre.

  2. Busque el elemento Touring Tire (sin el segundo elemento).

  3. Haga clic con el botón secundario en el elemento Touring Tire, seleccione Obtener detalles y, a continuación, seleccione Columnas de modelo y estructura.

    El cuadro de diálogo Obtener detalles muestra las transacciones individuales utilizadas como compatibilidad para este conjunto de elementos.

  4. Expanda la tabla anidada vAssocSeqLineItems para ver la lista real de compras en la transacción.

Para filtrar los conjuntos de elementos por compatibilidad o tamaño

  1. Borre cualquier texto que pudiera estar en el cuadro Filtrar conjunto de elementos. No puede utilizar un filtro del texto junto con un filtro numérico.

  2. En el cuadro Compatibilidad mínima, escriba 100 y, a continuación, haga clic en el segundo plano del visor.

    La lista de conjuntos de elementos se actualiza para mostrar sólo los conjuntos de elementos con una compatibilidad mínima de 100.

Volver al principio

Ficha Reglas

La ficha Reglas muestra la siguiente información relacionada con las reglas que el algoritmo encuentra.

  • Probabilidad: la probabilidad de una regla, definida como la probabilidad del elemento de la derecha dado el elemento de la izquierda.

  • Importancia: una medida de la utilidad de una regla. Un valor mayor significa una regla mejor.

    La importancia se proporciona para ayudarle a calibrar la utilidad de una regla, porque la probabilidad por sí sola puede ser engañosa. Por ejemplo, si cada transacción contuviera una botella de agua, quizás agregada automáticamente al carro de cada cliente como parte de una promoción, el modelo crearía una regla que predice que la botella de agua tiene una probabilidad de 1. Si se basa en la probabilidad únicamente, esta regla es muy precisa, pero no proporciona información útil.

  • **Regla:    **definición de la regla. Para un modelo de cesta de la compra, una regla describe una combinación concreta de elementos.

Cada regla puede usarse para predecir la presencia de un elemento de una transacción en función de la presencia de otros elementos. Al igual que con la ficha Conjuntos de datos, puede filtrar las reglas para mostrar sólo las más interesantes. Si está trabajando con un modelo de minería de datos que no tiene ninguna regla, podría desear cambiar los parámetros de algoritmo para bajar el umbral de probabilidad de las reglas.

Para ver sólo reglas que incluyen la bicicleta Mountain-200

  1. En la ficha Visor de modelos de minería de datos, haga clic en la ficha Reglas.

  2. En el cuadro Regla del filtro, escriba Mountain-200.

    Desactive la casilla Mostrar nombre largo.

  3. En la lista Mostrar, seleccione Mostrar sólo el nombre del atributo.

    A continuación, el visor sólo mostrará las reglas que contengan la palabra "Mountain-200". La probabilidad de la regla le indica la probabilidad de que, cuando alguien compre una bicicleta Mountain-200, también compre el otro producto enumerado.

Las reglas se ordenan por probabilidad en orden descendente, pero puede hacer clic en los encabezados de columna para cambiar el criterio de ordenación. Si le interesa averiguar más detalles sobre una regla determinada, puede utilizar la obtención de detalles para ver los casos complementarios.

Para ver los casos que complementan una regla determinada

  1. En la ficha Reglas, haga clic con el botón secundario en la regla que desea ver.

  2. Seleccione Obtener detalles y, a continuación, seleccione Sólo columnas de modelos o Columnas de modelo y estructura.

    El cuadro de diálogo Obtener detalles proporciona un resumen de la regla en la parte superior del panel y una lista de todos los casos que se utilizaron como datos complementarios para la regla.

Volver al principio

Visor de árboles de contenido genérico

Este visor se puede usar para todos los modelos, sin tener en cuenta el algoritmo o tipo de modelo. El Visor de árbol de contenido genérico de Microsoft está disponible en la lista desplegable Visor.

Un árbol de contenido es una representación de un modelo de minería como una serie de nodos, donde cada nodo representa el conocimiento adquirido acerca de cierto subconjunto de los datos. El nodo puede contener un modelo, un conjunto de reglas, un clúster o la definición de un intervalo de fechas que comparten ciertas características. El contenido exacto del nodo difiere dependiendo del algoritmo y el tipo del atributo predecible, pero la representación general del contenido es la misma. Puede expandir cada nodo para ver un mayor nivel de detalle y copiar el contenido de cualquier nodo en el Portapapeles.

Para ver los detalles sobre la regla utilizando el visor de contenido

  1. En la ficha Visor de modelos de minería de datos, seleccione Visor de árbol de contenido genérico de Microsoft en la lista Visor.

  2. En el panel Título de nodo, desplácese a la parte inferior de la lista y haga clic en el último nodo.

    El visor muestra los conjuntos de elementos primero y las reglas después, pero no los agrupa. La manera más fácil de buscar un nodo concreto es crear una consulta de contenido. Para obtener más información, vea Consultar un modelo de asociación (Analysis Services - Minería de datos).

  3. En el panel Detalles de nodo, revise el valor de NODE_TYPE y NODE_DESCRIPTION.

    Un tipo de nodo 8 es una regla y un tipo de nodo 7 es un conjunto de elementos. Para una regla, el valor de NODE_DESCRIPTION indica las condiciones que la constituyen. Para un conjunto de elementos, el valor de NODE_DESCRIPTION indica los elementos incluidos en el conjunto de elementos.

También puede crear una consulta de contenido para obtener estadísticas detalladas sobre las reglas. Para obtener más información sobre el contenido del modelo de minería de datos y cómo interpretarlo, vea Contenido del modelo de minería de datos para los modelos de asociación (Analysis Services - Minería de datos).

Volver al principio