Tutorial básico de minería de datos
Le damos la bienvenida al Tutorial básico de minería de datos de Microsoft Analysis Services. Microsoft SQL Server proporciona un entorno integrado para crear modelos de minería de datos y realizar predicciones. En este tutorial, completará un escenario de una campaña de envío de correo directo en el que se utiliza aprendizaje automático para analizar y predecir el comportamiento de compra de los clientes. En el tutorial se muestra cómo utilizar tres de los algoritmos más importantes de minería de datos: agrupación en clústeres, árboles de decisión y Bayes Naive. También aprenderá a analizar los resultados mediante los visores de modelos de minería de datos y a crear predicciones y gráficos de precisión mediante las herramientas de minería de datos que se incluyen en Microsoft SQL Server Analysis Services. La empresa ficticia Adventure Works Cycles se usa para todos los ejemplos.
Cuando se sienta cómodo con las herramientas de minería de datos, se recomienda completar también el Tutorial intermedio de minería de datos (Analysis Services - Minería de datos). En las lecciones se muestra cómo utilizar el pronóstico, análisis de la cesta de compras, series temporales, modelos de asociación, tablas anidadas y clústeres de secuencia.
Escenario del tutorial
En este tutorial, es un empleado de Adventure Works Cycles que se ha encargado de obtener más información sobre los clientes de la empresa en función de las compras históricas y, a continuación, usar esos datos históricos para realizar predicciones que se pueden usar en el marketing. La compañía no ha trabajado previamente con minería de datos, por lo que debe crear una nueva base de datos específica para minería de datos y configurar varios modelos de minería de datos.
Aprendizaje
Este tutorial le enseña a crear diferentes tipos de métodos de aprendizaje automático y a trabajar con ellos. También aprenderá a crear una copia de un modelo de minería de datos y aplicar un filtro a los datos de entrada para obtener resultados diferentes. Después, puede comparar los resultados de ambos modelos mediante un gráfico de elevación. Por último, utilizará la obtención de detalles para recuperar datos adicionales de la estructura de minería de datos subyacente.
La minería de datos de Microsoft Analysis Services incluye las siguientes características que le ayudan a desarrollar y comparar fácilmente varios modelos predictivos y, a continuación, realizar acciones en los resultados :
Conjuntos de pruebas de datos de exclusión: al crear una estructura de minería de datos, ahora puede dividir los datos de la estructura en conjuntos de prueba y de entrenamiento. Esto permite probar modelos en conjuntos de datos similares y comparar la precisión de los modelos relacionados.
Filtros de modelo de minería de datos: ahora puede adjuntar filtros a un modelo de minería de datos y aplicar el filtro durante el entrenamiento y las pruebas. Esto permite con facilidad generar modelos relacionados en diferentes subconjuntos de datos.
Obtención de detalles para casos de estructura y columnas de estructura : ahora puede cambiar fácilmente de los patrones generales del modelo de minería de datos al detalle procesable en el origen de datos.
El tutorial está compuesto por las lecciones siguientes:
Lección 1: Preparar la base de datos de Analysis Services (tutorial básico de minería de datos)
En esta lección, aprenderá a crear una nueva base de datos de Analysis Services, agregar un origen de datos y una vista del origen de datos y preparar la nueva base de datos para usarla con la minería de datos.
Lección 2: Generar una estructura de distribución de correo directo (Tutorial básico de minería de datos)
En esta lección, aprenderá a crear una estructura de modelos de minería de datos que se puede utilizar como parte de un escenario de distribución de correo directo.
Lección 3: Adición y procesamiento de modelos
En esta lección obtendrá información sobre cómo agregar modelos a una estructura. Los modelos que crea se generan con los algoritmos siguientes:
Árboles de decisión de Microsoft
Clústeres de Microsoft
Bayes naive de Microsoft
Lección 4: Explorar los modelos de correo directo (tutorial básico de minería de datos)
En esta lección obtendrá información sobre cómo explorar e interpretar los hallazgos de cada modelo usando los visores.
Lección 5: Probar los modelos (Tutorial básico de minería de datos)
En esta lección, realiza una copia de uno de los modelos de distribución de correo directo, agrega un filtro de modelo de minería de datos para restringir los datos de entrenamiento a un conjunto determinado de clientes y, a continuación, evalúa la viabilidad del modelo.
Lección 6: Crear y trabajar con predicciones (Tutorial básico de minería de datos)
En esta lección final del Tutorial básico de minería de datos, utiliza el modelo para predecir qué clientes tienen más probabilidad de comprar una bicicleta. A continuación, obtendrá detalles de los casos subyacentes para conseguir información de contacto.
Requisitos
Asegúrese de que los siguientes componentes estén instalados:
Microsoft SQL Server 2014
Microsoft SQL Server Analysis Services en modo multidimensional
La base de datos AdventureWorksDW2012 .
Para mejorar la seguridad, las bases de datos de ejemplo no se instalan con SQL Server. Para instalar las bases de datos oficiales de Microsoft SQL Server, visite la página Bases de datos de ejemplo de Microsoft SQL y seleccione SQL Server 2014.
Nota:
Al trabajar con el tutorial, le resultará más fácil avanzar o retroceder pasos si agrega los botones Tema siguiente y Tema anterior a la barra de herramientas del visor de documentos.
Consulte también
Soluciones de minería de datos
Tareas y procedimientos de los modelos de minería de datos
Crear y consultar modelos de minería de datos con DMX: tutoriales (Analysis Services - minería de datos)