Compartir a través de


Requisitos y consideraciones de procesamiento (minería de datos)

Se aplica a: SQL Server 2019 y versiones anteriores de Analysis Services Azure Analysis Services Fabric/Power BI Premium

Importante

La minería de datos estaba en desuso en SQL Server 2017 Analysis Services y ahora se ha interrumpido en SQL Server 2022 Analysis Services. La documentación no se actualiza para las características en desuso e interrumpidas. Para más información, consulte Compatibilidad con versiones anteriores de Analysis Services.

En este tema se describen algunas consideraciones técnicas que debe tener en cuenta al procesar objetos de minería de datos. Para obtener una explicación general de qué es el procesamiento y cómo se aplica a la minería de datos, vea Procesar objetos de minería de datos.

Consultas en el almacén relacional

Procesar estructuras de minería de datos

Procesamiento de modelos de minería de datos

Consultas en el almacén relacional durante el procesamiento

En la minería de datos, hay tres fases para el procesamiento: consultar los datos de origen, determinar las estadísticas sin tratar y usar la definición del modelo y el algoritmo para entrenar el modelo de minería de datos.

El SQL Server Analysis Services servidor emite consultas a la base de datos que proporciona los datos sin procesar. Esta base de datos puede ser una instancia de SQL Server 2017 o una versión anterior del motor de base de datos de SQL Server. Cuando se procesa una estructura de minería de datos, los datos del origen se transfieren a la estructura de minería de datos y se conservan en el disco en un nuevo formato comprimido. No se procesan todas las columnas del origen de datos sino únicamente aquellas que están incluidas en la estructura de minería de datos, de acuerdo con la definición de los enlaces.

Con estos datos, SQL Server Analysis Services crea un índice de todos los datos y columnas discretizadas y crea un índice independiente para las columnas continuas. Se emite una consulta por cada tabla anidada para crear el índice y se genera una consulta adicional por cada tabla anidada para procesar las relaciones entre cada par de una tabla anidada y tabla de casos. La razón de crear varias consultas es procesar un almacén interno especial de datos multidimensionales. Puede limitar el número de consultas que SQL Server Analysis Services envía al almacén relacional estableciendo la propiedad de servidor DatabaseConnectionPoolMax. Para más información, consulte OLAP Properties.

Al procesar el modelo, éste no vuelve a leer directamente los datos del origen de datos, sino que recibe el resumen de los datos de la estructura de minería de datos. Utilizando el cubo que se creó, junto con el índice y los datos del caso almacenados en memoria caché, el servidor crea subprocesos independientes para entrenar los modelos.

Para obtener más información sobre las ediciones de SQL Server que admiten procesamiento de modelos paralelos, vea Características compatibles con las ediciones de SQL Server 2012 (https://go.microsoft.com/fwlink/?linkid=232473).

Procesar estructuras de minería de datos

Una estructura de minería de datos se puede procesar con todos los modelos dependientes, o por separado. Procesar una estructura de minería de datos independientemente de los modelos puede ser útil cuando se prevé que el procesamiento de algunos modelos llevará mucho tiempo y se desee diferir esa operación.

Para más información, consulte Process a Mining Structure.

Si le preocupa conservar el espacio en disco duro, tenga en cuenta que SQL Server Analysis Services conserva las memorias caché de la estructura de minería de datos localmente. Es decir, escribe todos los datos de entrenamiento en el disco duro local. Si no quiere almacenar en caché los datos, puede cambiar la opción predeterminada estableciendo la propiedad MiningStructureCacheMode de la estructura de minería de datos en ClearAfterProcessing. Esto eliminará la caché una vez procesados los modelos; sin embargo, también deshabilitará la obtención de detalles en la estructura de minería de datos. Para obtener más información, vea Consultas de obtención de detalles (minería de datos) .

Por otra parte, si borra la caché, no podrá utilizar el conjunto de pruebas de exclusión, si definió uno, y se perderá la definición de la partición del conjunto de pruebas. Para obtener más información sobre los conjuntos de pruebas de espera, consulte Conjuntos de datos de entrenamiento y pruebas.

Procesar modelos de minería de datos

Puede procesar un modelo de minería de datos independientemente de su estructura de minería de datos asociados, o puede procesar todos los modelos basados en la estructura, junto con la estructura.

Para más información, vea Procesar un modelo de minería de datos.

Sin embargo, en SQL Server Data Tools y SQL Server Management Studio, no se pueden seleccionar varios modelos de minería de datos para procesarlos con la estructura . Si necesita controlar cómo se procesan los modelos, deberá seleccionarlos individualmente, o usar XMLA o DMX para procesarlos en serie.

Cuándo es necesario un nuevo procesamiento

Debe procesar los modelos SQL Server Analysis Services que defina antes de empezar a trabajar con ellos. También debe volver a procesar los modelos de minería de datos siempre que cambie la estructura del modelo de minería de datos, actualice los datos de aprendizaje, cambie el modelo de minería de datos existente o agregue un nuevo modelo de minería de datos a la estructura.

Los modelos de minería de datos también se procesan en estos casos:

Implementación de un proyecto: dependiendo de la configuración del proyecto y de su estado actual, los modelos de minería de datos del proyecto normalmente se procesan por completo cuando se implementa el proyecto.

Al iniciar la implementación, el procesamiento se inicia automáticamente, a menos que haya una versión procesada previamente en el servidor SQL Server Analysis Services y no haya cambios estructurales. Puede implementar un proyecto seleccionando Implementar solución en la lista desplegable o presionando la tecla F5. Puede

Para obtener más información sobre cómo establecer SQL Server Analysis Services propiedades de implementación que controlan cómo se implementan los modelos de minería de datos, consulte Implementación de soluciones de minería de datos.

Mover un modelo de minería de datos: al mover un modelo de minería de datos usando el comando EXPORT, solo se exportará la definición del modelo, lo que incluye el nombre de la estructura de minería de datos que se espera que proporcione datos al modelo.

Requisitos de nuevo procesamiento en los siguientes escenarios con los comandos EXPORT e IMPORT:

  • La estructura de minería de datos existe en la instancia de destino y la estructura de minería de datos está en un estado sin procesar.

    La estructura y el modelo se deben volver a procesar.

  • La estructura de minería de datos existe en la instancia de destino y se ha procesado la estructura de minería de datos. Solo el modelo de minería de datos se ha exportado.

    El modelo se puede utilizar sin procesar.

  • La definición de la estructura de minería de datos también se exportó utilizando la palabra clave WITH DEENDENCIES.

    La estructura y el modelo se deben volver a procesar.

Para más información, vea Exportar e importar objetos de minería de datos.

Consulte también

Estructuras de minería de datos (Analysis Services - Minería de datos)
Estructuras de minería de datos (Analysis Services - Minería de datos)
Procesar un modelo multidimensional (Analysis Services)