Tutorial DMX de Bike Buyer
Actualizado: 15 de septiembre de 2007
En este tutorial aprenderá a crear, entrenar y explorar modelos de minería de datos utilizando el lenguaje de consulta Extensiones de minería de datos (DMX). A continuación, estos modelos de minería de datos se utilizarán para crear predicciones que determinan si un cliente adquirirá una bicicleta.
Los modelos de minería de datos se crearán a partir de los datos incluidos en la base de datos de ejemplo AdventureWorksDW, que almacena datos de la empresa ficticia Adventure Works Cycles. Adventure Works Cycles es una gran empresa multinacional de fabricación. La empresa fabrica y vende bicicletas de metal y de materiales compuestos en los mercados de Norteamérica, Europa y Asia. Su sede central de operaciones se encuentra en Bothell, Washington, con 290 empleados, y tiene distribuidos varios equipos regionales de ventas en toda su base de mercado internacional. Para obtener más información acerca de la base de datos de ejemplo AdventureWorksDW, vea Almacén de datos de ejemplo AdventureWorksDW.
Escenario del tutorial
Adventure Works Cycles ha decidido ampliar su análisis de datos mediante la creación de una aplicación personalizada que utilice la funcionalidad de minería de datos. El objetivo de la aplicación personalizada es poder:
- Tomar como datos de entrada características concretas acerca de un cliente potencial y predecir si adquirirá una bicicleta.
- Tomar como datos de entrada una lista de clientes potenciales, así como características acerca de los clientes, y predecir qué clientes adquirirán una bicicleta.
En el primer caso, los datos del cliente provienen de una página de registro de clientes y, en el segundo caso, el departamento de marketing de Adventure Works Cycles proporciona una lista de clientes potenciales.
Además, el departamento de marketing ha solicitado la capacidad de agrupar clientes existentes en categorías basadas en características como, por ejemplo, su lugar de residencia, el número de hijos que tienen y la distancia que tienen que recorrer para llegar al trabajo. Desean ver si estos clústeres se pueden usar para ayudar a dirigir campañas a tipos concretos de clientes. Esto requerirá un modelo de minería de datos adicional.
Microsoft SQL Server 2005 Analysis Services (SSAS) proporciona varias herramientas que se pueden utilizar para realizar estas tareas:
- El lenguaje de consulta DMX
- El Algoritmo de árboles de decisión de Microsoft y el Algoritmo de clústeres de Microsoft
- El Editor de consultas de SQL Server Management Studio
Extensiones de minería de datos (DMX) es un lenguaje de consulta proporcionado por Analysis Services que sirve para crear y trabajar con modelos de minería de datos. El algoritmo de árboles de decisión de Microsoft crea modelos que se pueden utilizar para predecir si alguien adquirirá una bicicleta. El modelo resultante puede tomar un cliente individual o una tabla de clientes como entrada. El algoritmo de clústeres de Microsoft puede crear agrupaciones de clientes basadas en características compartidas. El objetivo de este tutorial es proporcionar las secuencias de comandos DMX que se utilizarán en la aplicación personalizada.
Para obtener más información:Trabajar con minería de datos
Estructura de minería de datos y modelos de minería de datos
Antes de empezar a crear instrucciones DMX, es importante comprender los objetos principales utilizados por Analysis Services para crear modelos de minería de datos. La estructura de minería de datos es una estructura de datos que define el dominio de datos a partir del cual se generan los modelos de minería de datos. Una estructura de minería de datos sencilla puede contener varios modelos de minería de datos que comparten el mismo dominio. Un modelo de minería de datos aplica un algoritmo de modelo de minería a los datos, que se representan en una estructura de minería de datos.
Las unidades de creación de la estructura de minería de datos son las columnas de la estructura de minería de datos, que describen los datos que contiene el origen de datos. Estas columnas contienen información como el tipo de datos, el tipo de contenido y el modo en que se distribuyen los datos.
Las columnas de los modelos de minería de datos deben incluir la columna de clave descrita en la estructura de minería de datos, así como un subconjunto de las columnas restantes. El modelo de minería de datos define el uso de cada columna y el algoritmo utilizado para crearlo. Por ejemplo, en DMX puede especificar que una columna sea una columna de clave o una columna PREDICT. Si una columna no se especifica, se considera que es una columna de entrada.
En DMX, hay dos formas de crear modelos de minería de datos. Puede crear la estructura de minería de datos y el modelo de minería de datos asociado juntos, utilizando la instrucción CREATE MINING MODEL, o bien, puede crear primero una estructura de minería de datos, utilizando la instrucción CREATE MINING STRUCTURE, y, a continuación, agregar un modelo de minería de datos a la estructura, utilizando la instrucción ALTER STRUCTURE. Estos métodos se describen a continuación.
CREATE MINING MODEL
Utilice esta instrucción para crear una estructura de minería de datos y el modelo de minería de datos asociado juntos, con el mismo nombre. Se anexa "Structure" al nombre del modelo de minería de datos para diferenciarlo de la estructura de minería de datos. Esta instrucción resulta útil si crea una estructura de minería de datos que incluirá un único modelo de minería de datos.Para obtener más información, vea CREATE MINING MODEL (DMX).
ALTER MINING STRUCTURE
Utilice esta instrucción para agregar un modelo de minería de datos a una estructura de minería de datos que ya existe en el servidor. Esta instrucción resulta útil si desea crear una estructura de minería de datos que incluya varios modelos de minería de datos. Hay varios motivos por los que puede desear agregar más de un modelo de minería de datos en una única estructura de minería de datos. Por ejemplo, puede crear varios modelos de minería de datos utilizando algoritmos distintos para ver qué modelo funciona mejor con sus datos. Puede crear varios modelos de minería de datos utilizando el mismo algoritmo, pero con un parámetro establecido de forma distinta para cada uno de ellos, para encontrar el mejor valor para el parámetro.Para obtener más información, vea ALTER MINING STRUCTURE (DMX).
Puesto que creará una estructura de minería de datos que contiene varios modelos de minería de datos, utilizará el segundo método en este tutorial.
Para obtener más información
Referencia de Extensiones de minería de datos (DMX), Descripción de la instrucción Select (DMX), Consultas de predicción (DMX)
Aprendizaje
El tutorial está compuesto por las lecciones siguientes:
- Lección 1: Crear la estructura de minería de datos de Bike Buyer
En esta lección aprenderá a utilizar la instrucción CREATE para crear estructuras de minería de datos.
- Lección 2: Agregar modelos de minería a la estructura de minería de datos de Bike Buyer
En esta lección aprenderá a utilizar la instrucción ALTER para agregar modelos de minería de datos a una estructura de minería de datos.
- Lección 3: Procesar la estructura de minería de datos de Bike Buyer
En esta lección aprenderá a utilizar la instrucción INSERT INTO para procesar estructuras de minería de datos y sus modelos de minería de datos asociados.
- Lección 4: Examinar los modelos de minería de datos de Bike Buyer
En esta lección aprenderá a utilizar la instrucción SELECT para explorar el contenido de los modelos de minería de datos.
- Lección 5: Ejecutar consultas de predicción
En esta lección aprenderá a utilizar la instrucción PREDICTION JOIN para crear predicciones basadas en modelos de minería de datos.
Requisitos
Antes de hacer este tutorial, asegúrese de que los siguientes componentes estén instalados:
- Microsoft SQL Server 2005
- Microsoft SQL Server 2005 Analysis Services (SSAS)
- La base de datos AdventureWorks que se incluye con SQL Server 2005. Con el fin de mejorar la seguridad, las bases de datos de ejemplo no se instalan de forma predeterminada. Para obtener más información acerca de cómo instalar las bases de datos de ejemplo, vea Ejecutar el programa de instalación para instalar los ejemplos y las bases de datos de ejemplo AdventureWorks.
[!NOTA] Para consultar los tutoriales, se recomienda agregar los botones Siguiente y Anterior a la barra de herramientas del visor de documentos. Para obtener más información, vea Agregar los botones Siguiente y Anterior a la Ayuda.
Vea también
Conceptos
Tutorial DMX de Market Basket
Tutorial de minería de datos