Compartir a través de


Crear una estructura del modelo de minería de datos de distribución de correo directo (Tutorial básico de minería de datos)

El primer paso para crear un escenario de correo dirigido es usar el Asistente para minería de datos en SQL Server Data Tools (SSDT) para crear una nueva estructura de minería de datos y un modelo de minería de datos de árbol de decisión.

En esta tarea, configurará una nueva estructura de minería de datos y agregará un modelo de minería de datos inicial basado en el algoritmo de árboles de decisión de Microsoft. Para crear la estructura, primero seleccionará las tablas y vistas, y a continuación identificará qué columnas se utilizarán para el entrenamiento y cuáles para pruebas.

Para crear una estructura de minería de datos para un escenario de distribución de correo directo

  1. En Explorador de soluciones, haga clic con el botón derecho en Estructuras de minería de datos y seleccione Nueva estructura de minería de datos para iniciar el Asistente para minería de datos.

  2. En la página de inicio del Asistente para minería de datos , haga clic en Siguiente.

  3. En la página Seleccionar el método de definición , compruebe que en la base de datos relacional o el almacenamiento de datos existente está seleccionada y, a continuación, haga clic en Siguiente.

  4. En la página Crear la estructura de minería de datos, en ¿Qué técnica de minería de datos desea usar?, seleccione Árboles de decisión de Microsoft.

    Nota:

    Si aparece una advertencia de que no se puede encontrar ningún algoritmo de minería de datos, puede que las propiedades del proyecto no estén configuradas correctamente. Esta advertencia se produce cuando el proyecto intenta recuperar una lista de algoritmos de minería de datos del servidor de Analysis Services y no encuentra el servidor. De forma predeterminada, SQL Server Data Tools usará localhost como servidor. Si está utilizando una instancia diferente o una instancia con nombre, debe cambiar las propiedades del proyecto. Para obtener más información, vea Crear un proyecto de Analysis Services (Tutorial básico de minería de datos).

  5. Haga clic en Next.

  6. En la página Seleccionar vista del origen de datos, en el panel Vistas del origen de datos disponibles , seleccione Correo de destino. Puede hacer clic en Examinar para ver las tablas en la vista del origen de datos y, a continuación, hacer clic en Cerrar para volver al asistente.

  7. Haga clic en Next.

  8. En la página Especificar tipos de tabla , active la casilla de verificación de la columna Caso para que vTargetMail la use como tabla de casos y, a continuación, haga clic en Siguiente. Utilizará la tabla ProspectiveBuyer posteriormente para pruebas; pásela por alto por ahora.

  9. En la página Especificar los datos de entrenamiento , identificará al menos una columna de predicción, una columna de clave y una columna de entrada para el modelo. Active la casilla de la columna Predicción de la fila BikeBuyer .

    Nota

    Observe la advertencia en la parte inferior de la ventana. No podrá navegar a la página siguiente hasta que seleccione al menos una entrada y una columna de predicción .

  10. Haga clic en Sugerir para abrir el cuadro de diálogo Sugerir columnas relacionadas .

    El botón Sugerir está habilitado siempre que se haya seleccionado al menos un atributo de predicción. En el cuadro de diálogo Sugerir columnas relacionadas se enumeran las columnas más estrechamente relacionadas con la columna de predicción y se ordena los atributos por su correlación con el atributo de predicción. Las columnas con una correlación significativa (con una confianza mayor del 95%) se seleccionan automáticamente para incluirse en el modelo.

    Revise las sugerencias y, a continuación, haga clic en Cancelar para recuperar las sugerencias.

    Nota

    Si hace clic en Aceptar, todas las sugerencias enumeradas se marcarán como columnas de entrada en el asistente. Si está de acuerdo con solamente algunas de las sugerencias, debe cambiar los valores manualmente.

  11. Compruebe que la casilla de la columna Clave está seleccionada en la fila CustomerKey .

    Nota

    Si la tabla de origen de la vista del origen de datos muestra una clave, el Asistente para minería de datos elegirá automáticamente esa columna como clave para el modelo.

  12. Active las casillas de la columna Entrada en las filas siguientes. Puede activar varias columnas resaltando un rango de celdas y presionando CTRL mientras activa una casilla.

    • Age

    • CommuteDistance

    • EnglishEducation

    • EnglishOccupation

    • Gender: sexo

    • GeographyKey

    • HouseOwnerFlag

    • MaritalStatus

    • NumberCarsOwned

    • NumberChildrenAtHome

    • Región

    • TotalChildren

    • YearlyIncome

  13. En la columna izquierda de la página, active las casillas de las filas siguientes.

    • AddressLine1

    • AddressLine2

    • DateFirstPurchase

    • EmailAddress

    • Nombre

    • Apellidos

    Asegúrese de que estas filas solo tienen marcas en la columna izquierda. Estas columnas se agregarán a la estructura, pero no se incluirán en el modelo. Sin embargo, una vez generado el modelo, estarán disponibles para la obtención de detalles y las pruebas. Para obtener más información sobre la obtención de detalles, vea Consultas de obtención de detalles (minería de datos)

  14. Haga clic en Next.

Siguiente tarea de la lección

Especificar el tipo de datos y el tipo de contenido (Tutorial básico de minería de datos)

Consulte también

Especificar tipos de tablas (Asistente para minería de datos)
Data Mining Designer
Algoritmo de árboles de decisión de Microsoft