Algoritmos de minería de datos (Analysis Services: Minería de datos)
El algoritmo de minería de datos es el mecanismo que crea un modelo de minería de datos. Para crear un modelo, un algoritmo analiza primero un conjunto de datos y luego busca patrones y tendencias específicos. El algoritmo utiliza los resultados de este análisis para definir los parámetros del modelo de minería de datos. A continuación, estos parámetros se aplican en todo el conjunto de datos para extraer patrones procesables y estadísticas detalladas.
El modelo de minería de datos que crea un algoritmo puede tomar diversas formas, incluyendo:
Un conjunto de reglas que describen cómo se agrupan los productos en una transacción.
Un árbol de decisión que predice si un cliente determinado comprará un producto.
Un modelo matemático que predice las ventas.
Un conjunto de clústeres que describe cómo se relacionan los casos de un conjunto de datos.
MicrosoftSQL ServerAnalysis Services proporciona varios algoritmos que puede usar en las soluciones de minería de datos. Estos algoritmos son un subconjunto de todos los algoritmos que pueden utilizarse en la minería de datos. También puede utilizar algoritmos de minería de datos desarrollados por terceros que cumplan la especificación OLE DB para minería de datos. Para obtener más información sobre los algoritmos de terceros, vea Algoritmos de complemento.
Tipos de algoritmos de minería de datos
Analysis Services incluye los siguientes tipos de algoritmos:
Algoritmos de clasificación, que predicen una o más variables discretas, basándose en otros atributos del conjunto de datos. Un ejemplo de algoritmo de clasificación es el Algoritmo de árboles de decisión de Microsoft.
Algoritmos de regresión, que predicen una o más variables continuas, como las pérdidas o los beneficios, basándose en otros atributos del conjunto de datos. Un ejemplo de algoritmo de regresión es el Algoritmo de serie temporal de Microsoft.
Algoritmos de segmentación, que dividen los datos en grupos, o clústeres, de elementos que tienen propiedades similares. Un ejemplo de algoritmo de segmentación es el Algoritmo de clústeres de Microsoft.
Algoritmos de asociación, que buscan correlaciones entre diferentes atributos de un conjunto de datos. La aplicación más común de esta clase de algoritmo es la creación de reglas de asociación, que pueden utilizarse en un análisis de la cesta de compra. Un ejemplo de algoritmo de asociación es el Algoritmo de asociación de Microsoft.
Algoritmos de análisis de secuencias, que resumen secuencias o episodios frecuentes en los datos, como un flujo de rutas Web. Un ejemplo de algoritmo de análisis de secuencias es el Algoritmo de agrupación en clústeres de secuencia de Microsoft.
Aplicar los algoritmos
La elección del mejor algoritmo para una tarea empresarial específica puede ser un desafío. Aunque puede utilizar diferentes algoritmos para realizar la misma tarea, cada uno de ellos genera un resultado diferente, y algunos pueden generar más de un tipo de resultado. Por ejemplo, puede usar el algoritmo Árboles de decisión de Microsoft no sólo para la predicción, sino también como una forma de reducir el número de columnas de un conjunto de datos, ya que el árbol de decisión puede identificar las columnas que no afectan al modelo de minería de datos final.
Tampoco es necesario usar los algoritmos de modo independiente. En una única solución de minería de datos se pueden usar algunos algoritmos para explorar datos y, posteriormente, usar otros algoritmos para predecir un resultado específico a partir de esos datos. Por ejemplo, puede utilizar un algoritmo de agrupación en clústeres, que reconoce patrones, para dividir los datos en grupos que sean más o menos homogéneos, y luego usar los resultados para crear un mejor modelo de árbol de decisión. Puede utilizar varios algoritmos dentro de una solución para realizar tareas independientes, por ejemplo, usar un algoritmo de árbol de regresión para obtener información de previsiones financieras y un algoritmo basado en reglas para llevar a cabo un análisis de la cesta de compra.
Los modelos de minería de datos pueden predecir valores, generar resúmenes de datos y buscar correlaciones ocultas. Para ayudarle a seleccionar los algoritmos para su solución de minería de datos, la siguiente tabla proporciona sugerencias sobre qué algoritmos usar en tareas específicas.
Tarea |
Algoritmos de Microsoft que se pueden usar |
---|---|
Predecir un atributo discreto. Por ejemplo, predecir si el destinatario de una campaña de envío de correo directo adquirirá un producto. |
Algoritmo de árboles de decisión de Microsoft Algoritmo Bayes naive de Microsoft |
Predecir un atributo continuo. Por ejemplo, prever las ventas del año próximo. |
|
Predecir una secuencia. Por ejemplo, realizar un análisis clickstream del sitio web de una empresa. |
Algoritmo de agrupación en clústeres de secuencia de Microsoft |
Buscar grupos de elementos comunes en las transacciones. Por ejemplo, utilizar el análisis de la cesta de la compra para sugerir a un cliente la compra de productos adicionales. |
|
Buscar grupos de elementos similares. Por ejemplo, segmentar datos demográficos en grupos para comprender mejor las relaciones entre atributos. |
Algoritmo de clústeres de Microsoft Algoritmo de agrupación en clústeres de secuencia de Microsoft |
Debido a que cada modelo devuelve un tipo de resultado diferente, Analysis Services proporciona un visor independiente para cada algoritmo. Cuando se examina un modelo de minería de datos en Analysis Services, el modelo se muestra en la ficha Visor de modelos de minería de datos del Diseñador de minería de datos, que usa el visor adecuado para el modelo. Para obtener más información, vea Ver un modelo de minería de datos.
Detalles del algoritmo
En la tabla siguiente se proporcionan vínculos a los tipos de información disponible para cada algoritmo:
Descripción básica del algoritmo: proporciona una explicación básica de lo que el algoritmo hace y cómo funciona, junto con un escenario empresarial donde podría resultar útil.
Referencia técnica: muestra los parámetros que pueden establecerse para controlar el comportamiento del algoritmo y personalizar los resultados en el modelo. Proporciona detalles técnicos adicionales sobre la implementación del algoritmo, sugerencias de rendimiento y requisitos de los datos.
Consultar un modelo: proporciona ejemplos de consultas que puede utilizar con cada tipo de modelo.Puede consultar un modelo para obtener más información sobre los patrones que contiene o para realizar predicciones basándose en dichos patrones.
Contenido del modelo de minería de datos: describe cómo se almacena la información en una estructura común para todos los tipos de modelos y explica cómo interpretarla. Una vez generado un modelo, se puede explorar usando los visores proporcionados por BI Development Studio o se pueden escribir consultas que devuelvan información directamente del contenido del modelo usando DMX.