Compartir a través de


Explorar el modelo de árbol de decisión (tutorial básico de minería de datos)

El algoritmo de árboles de decisión de Microsoft predice qué columnas influyen en la decisión de comprar una bicicleta en función de las columnas restantes del conjunto de entrenamiento.

Pestaña Árbol de decisión

En la pestaña Árbol de decisión, puede ver los árboles de decisión de cada atributo de predicción del conjunto de datos.

En este caso, el modelo solo predice una columna, Bike Buyer, por lo que solo hay un árbol para ver. Si hubiera más árboles, podría usar el cuadro Árbol para elegir otro árbol.

Al ver el TM_Decision_Tree modelo en el visor de árbol de decisión, puede ver los atributos más importantes en el lado izquierdo del gráfico. "Más importante" significa que estos atributos tienen la mayor influencia en el resultado. Los atributos situados más abajo en el árbol (a la derecha del gráfico) tiene menos efecto.

En este ejemplo, la edad es el factor único más importante para predecir la compra de bicicletas. El modelo agrupa los clientes por edad y, a continuación, muestra el siguiente atributo más importante para cada grupo de edad. Por ejemplo, en el grupo de clientes de entre 34 y 40 años, el número de automóviles en propiedad es el factor de predicción más seguro después de la edad.

Para explorar el modelo en la pestaña Árbol de decisión

  1. Seleccione la pestaña Visor de modelo de minería de datos en Diseñador de minería de datos.

    De forma predeterminada, el diseñador se abre al primer modelo que se agregó a la estructura ; en este caso, TM_Decision_Tree.

  2. Utilice los botones de lupa para ajustar el tamaño de presentación del árbol.

    De forma predeterminada, el Visor de árboles de Microsoft muestra solo los tres primeros niveles del árbol. Si el árbol contiene menos de tres niveles, el visor mostrará solo los niveles existentes. Puede ver más niveles mediante el control deslizante Mostrar nivel o la lista Expansión predeterminada .

  3. Nivel de presentación con diapositivas a la cuarta barra.

  4. Cambie el valor background a 1.

    Al cambiar la configuración De fondo , puede ver rápidamente el número de casos en cada nodo que tienen el valor de destino de 1 para [Bike Buyer]. Recuerde que en este escenario en concreto, cada caso representa un cliente. El valor 1 indica que el cliente compró previamente una bicicleta; el valor 0 indica que el cliente no ha comprado una bicicleta. Cuanto más oscuro sea el sombreado del nodo, mayor será el porcentaje de casos del nodo que tienen el valor de destino.

  5. Coloque el cursor sobre el nodo con la etiqueta Todo. Se mostrará información sobre herramientas con los siguientes datos:

    • Número total de casos

    • Número de casos de personas que no han comprado bicicletas

    • Número de casos de personas que han comprado bicicletas

    • Número de casos con valores que faltan para [Bike Buyer]

    También puede colocar el cursor sobre cualquier nodo del árbol para ver la condición necesaria para alcanzar ese nodo desde el nodo anterior. También puede ver esta misma información en la Leyenda de minería de datos.

  6. Haga clic en el nodo de Age >=34 y < 41. El histograma se muestra como una barra horizontal delgada a lo largo del nodo y representa la distribución de los clientes con este intervalo de edad que anteriormente compraron (rosa) o no compraron (azul) una bicicleta. El visor nos muestra que es probable que los clientes con edades comprendidas entre 34 y 40 años sin automóvil o con uno compren una bicicleta. Si vamos un poco más lejos, vemos que la probabilidad de comprar una bicicleta aumenta si el cliente tiene una edad comprendida entre 38 y 40 años.

Como habilitó la obtención de detalles cuando creó la estructura y el modelo, puede recuperar información detallada de los casos del modelo y de la estructura de minería de datos, incluidas las columnas que no se incluyeron en el modelo de minería de datos (por ejemplo, emailAddress y FirstName).

Para obtener más información, vea Consultas de obtención de detalles (minería de datos) .

Para obtener información detallada de los datos del caso

  1. Haga clic con el botón derecho en un nodo y seleccione Obtención de detalles y, después, Solo columnas de modelo.

    Los detalles de cada caso de entrenamiento se muestran en formato de hoja de cálculo. Estos detalles proceden de la vista vTargetMail que seleccionó como la tabla de casos al generar la estructura de minería de datos.

  2. Haga clic con el botón derecho en un nodo y seleccione Obtención de detalles y, después, modelar y estructurar columnas.

    Se muestra la misma hoja de cálculo con las columnas de estructura anexadas al final.

Pestaña Red de dependencias

La pestaña Red de dependencias muestra las relaciones entre los atributos que contribuyen a la capacidad predictiva del modelo de minería de datos. El visor Red de dependencias reafirma nuestra conclusión de que la edad y la región son factores importantes para predecir la compra de bicicletas.

Para explorar el modelo en la pestaña Red de dependencias
  1. Haga clic en el Bike Buyer nodo para identificar sus dependencias.

    El nodo central de la red de dependencias, Bike Buyer, representa el atributo de predicción en el modelo de minería de datos. En el gráfico se resaltan todos los nodos conectados que afectan al atributo de predicción.

  2. Ajuste el control deslizante Todos los vínculos para identificar el atributo más influyente.

    Al arrastrar hacia abajo el control deslizante, los atributos que solo tienen un efecto débil en la columna [Bike Buyer] se quitan del gráfico. Ajustando el control deslizante, descubrirá que la edad y la región son los factores más importantes para predecir si alguien va a comprar una bicicleta.

Vea estos temas para explorar los datos con las demás clases de modelos.

Siguiente tarea de la lección

Explorar el modelo de agrupación en clústeres (Tutorial básico de minería de datos)

Consulte también

Tareas y procedimientos del Visor de modelos de minería de datos
Pestaña Árbol de decisión (Visor de modelos de minería de datos)
Pestaña Red de dependencias (Visor de modelos de minería de datos)
Examinar un modelo usando el Visor de árboles de Microsoft