Compartir a través de


Crear una estructura y un modelo de cesta de la compra (Tutorial intermedio de minería de datos)

Ahora que ha creado una vista del origen de datos, utilizará el Asistente para minería de datos con el fin de crear una nueva estructura de minería de datos. En esta tarea, creará una estructura y un modelo de minería de datos que se basen en el algoritmo de asociación de Microsoft.

[!NOTA]

Si encuentra un error que indica que vAssocSeqLineItems no se puede usar como una tabla anidada, vuelva a la tarea anterior de la lección y asegúrese de crear la combinación de varios a uno arrastrando desde la tabla vAssocSeqLineItems (el lado de varios) a la tabla vAssocSeqOrders (el lado de uno). También puede modificar la relación entre las tablas haciendo clic con el botón secundario en la línea de combinación.

Para crear una estructura de minería de datos de asociación

  1. En el Explorador de soluciones en Business Intelligence Development Studio, haga clic con el botón secundario en Estructuras de minería de datos y seleccione Nueva estructura de minería de datos para abrir el Asistente para minería de datos.

  2. En la página de inicio del Asistente para minería de datos, haga clic en Siguiente.

  3. En la página Seleccionar el método de definición, compruebe que la opción A partir de una base de datos relacional o del almacenamiento de datos se ha seleccionado y, a continuación, haga clic en Siguiente.

  4. En la página Crear la estructura de minería de datos, en ¿Qué técnica de minería de datos desea utilizar?, seleccione Reglas de asociación de Microsoft en la lista y, a continuación, haga clic en Siguiente. Aparecerá la página Seleccionar vista del origen de datos.

  5. Seleccione Orders en Vistas del origen de datos disponibles y, a continuación, haga clic en Siguiente.

  6. En la página Especificar tipos de tablas, para vAssocSeqLineItems, active la casilla Anidada. Para vAssocSeqOrders, active la casilla Caso. Haga clic en Siguiente.

    Como experimento, pruebe a usar vAssocSeqLineItems y vAssocSeqOrders como tabla de casos. Obtendrá un error. La tabla anidada siempre debe estar en el lado de varios de una relación con la tabla de casos.

  7. En la página Especificar los datos de aprendizaje, desactive las casillas que estén activadas, si hay alguna. Establezca la clave para la tabla de casos, vAssocSeqOrders, activando la casilla Clave situada al lado de OrderNumber.

    Dado que el propósito del análisis de la cesta de la compra es determinar qué productos están incluidos en una transacción única, no tiene que usar el campo CustomerKey.

  8. Establezca la clave para la tabla anidada, vAssocSeqLineItems, activando la casilla Clave al lado de Modelo. La casilla Entrada se activa también automáticamente al hacer esto. Active igualmente la casilla De predicción correspondiente a Modelo.

    En un modelo de cesta de la compra, no se preocupa de la secuencia de productos de la cesta de la compra y, por consiguiente, no debería incluir LineNumber como clave de la tabla anidada. Se usaría LineNumber como clave solo en un modelo en el que la secuencia fuera importante. Creará un modelo que use el algoritmo de clústeres de secuencia de Microsoft en la lección 4.

  9. Active la casilla situada a la izquierda de IncomeGroup y Region, pero no realice ninguna otra selección. Al activar la casilla, agrega las columnas a la estructura como referencia, pero no se utilizarán en el modelo.

    Las selecciones tendrán la apariencia siguiente:

    cuál debería ser la apariencia del cuadro de diálogo

  10. Haga clic en Siguiente.

  11. En la página Especificar el contenido y el tipo de datos de las columnas, revise las selecciones, que deberían mostrarse en la tabla siguiente, y a continuación haga clic en Siguiente.

    Columnas

    Tipo de contenido

    Tipo de datos

    IncomeGroup

    Discreto

    Texto

    OrderNumber

    Clave

    Texto

    Region

    Discreto

    Texto

    vAssocSeqLineItems

      

      

    Model

    Clave

    Texto

  12. En la página Crear conjunto de pruebas, el valor predeterminado para la opción Porcentaje de datos para pruebas es el 30 por ciento. Cámbielo a 0. Haga clic en Siguiente.

    [!NOTA]

    En el Tutorial básico de minería de datos creó un conjunto de pruebas para medir la exactitud del modelo. Los métodos para medir la exactitud del modelo que se proporcionan en Analysis Services, como el informe de validación cruzada y el gráfico de mejora respecto al modelo predictivo, se han diseñado para permitir la clasificación y valoración. No se pueden usar en la predicción asociativa.

  13. En la página Finalización del asistente, en Nombre de la estructura de minería de datos, escriba Association.

  14. En Nombre del modelo de minería de datos, escriba Asociación.

  15. Seleccione la opción Permitir obtención de detalles y, a continuación, haga clic en Finalizar.

    El Diseñador de minería de datos se abre para mostrar la estructura de minería de datos Association que acaba de crear.