Compartir a través de


Distribuciones de columnas (minería de datos)

En Microsoft SQL Server Analysis Services, puede definir distribuciones de columnas en una estructura de minería de datos para afectar a cómo los algoritmos procesan los datos de esas columnas al crear modelos de minería de datos. Para algunos algoritmos, resulta útil definir la distribución de las columnas continuas antes de procesar el modelo, si se sabe que las columnas contienen distribuciones de valores comunes. Si no define las distribuciones, los modelos de minería de datos resultantes podrían generar predicciones menos precisas que si se definieran las distribuciones porque los algoritmos disponen de menos información con la que interpretar los datos.

Los algoritmos disponibles en Analysis Services admiten los siguientes tipos de distribución:

Normal Los valores de la columna continua forman un histograma con una distribución normal.

Histograma con histograma de distribución normal

Log Normal Los valores de la columna continua forman un histograma, donde la curva se alarga en el extremo superior y se asimetría hacia el extremo inferior.

Histograma con histograma de distribución normal del

Uniform Los valores de la columna continua forman una curva plana, en la que todos los valores son igualmente probables.

Histograma con histograma de distribución uniforme

Para obtener más información sobre los algoritmos que proporciona Analysis Services, vea Algoritmos de minería de datos (Analysis Services - Minería de datos).

Consulte también

Tipos de contenido (minería de datos)Estructuras de minería de datos (Analysis Services - Minería de datos)Métodos de discretización (minería de datos)Distribuciones (DMX)Columnas de estructura de minería de datos