Compartir vía


CREATE MINING MODEL (DMX)

Se aplica a: SQL Server Analysis Services

Crea un nuevo modelo de minería de datos y una estructura de minería de datos en la base de datos. Para crear un modelo, puede definir el nuevo modelo en la instrucción o usar el Lenguaje de marcado de modelos de predicción (PMML). Esta segunda opción es solo para usuarios expertos.

Para asignar el nombre a la estructura de minería de datos, se anexa "_structure" al nombre del modelo, lo que garantiza que el nombre de la estructura sea distinto del nombre del modelo.

Para crear un modelo de minería de datos para una estructura de minería de datos existente, use la instrucción ALTER MINING STRUCTURE (DMX).

Sintaxis

  
CREATE [SESSION] MINING MODEL <model>  
(  
    [(<column definition list>)]  
)  
USING <algorithm> [(<parameter list>)] [WITH DRILLTHROUGH]  
CREATE MINING MODEL <model> FROM PMML <xml string>  

Argumentos

model
Nombre único del modelo.

lista de definiciones de columnas
Lista delimitada por comas de definiciones de columna.

algorithm
Nombre de un algoritmo de minería de datos definido por el proveedor actual.

Nota:

Se puede recuperar una lista de los algoritmos admitidos por el proveedor actual mediante DMSCHEMA_MINING_SERVICES conjunto de filas. Para ver los algoritmos admitidos en la instancia actual de Analysis Services, consulte Propiedades de minería de datos.

lista de parámetros
Opcional. Lista delimitada por comas de parámetros definidos por el proveedor para el algoritmo.

Cadena XML
(Solo para uso avanzado). Un modelo con codificación XML (PMML). La cadena debe estar entre comillas simples (').

La cláusula SESSION permite crear un modelo de minería de datos que se quita automáticamente del servidor cuando se cierra la conexión o se agota el tiempo de espera de la sesión. Los modelos de minería de datos SESSION son útiles porque no requieren que el usuario sea administrador de bases de datos y solo use espacio en disco mientras la conexión esté abierta.

La cláusula WITH DRILLTHROUGH permite explorar en profundidad el nuevo modelo de minería de datos. La obtención de detalles solo se puede habilitar al crear el modelo. En algunos tipos de modelo, la obtención de detalles es necesaria para examinar el modelo en el visor personalizado. La obtención de detalles no es necesaria para la predicción o para examinar el modelo utilizando el Visor de árbol de contenido genérico de Microsoft.

La instrucción CREATE MINING MODEL crea un nuevo modelo de minería de datos basado en la lista de definiciones de columnas, el algoritmo y la lista de parámetros del algoritmo.

Lista de definiciones de columna

Para definir la estructura de un modelo que usa la lista de definiciones de columna, debe incluir la siguiente información para cada columna:

  • Nombre (obligatorio)

  • Tipo de datos (obligatorio)

  • Distribución

  • Lista de marcas de modelado

  • Tipo de contenido (obligatorio)

  • Solicitud de predicción, que indica al algoritmo para predecir esta columna, indicada por la cláusula PREDICT o PREDICT_ONLY

  • Relación con una columna de atributo (obligatoria solo si se aplica), indicada por la cláusula RELATED TO

Use la siguiente sintaxis en la lista de definición de columnas para definir una sola columna:

<column name>    <data type>    [<Distribution>]    [<Modeling Flags>]    <Content Type>    [<prediction>]    [<column relationship>]   

Use la siguiente sintaxis en la lista de definición de columnas para definir una columna de tabla anidada:

<column name>    TABLE    [<prediction>] ( <non-table column definition list> )  

Excepto en el caso de las marcas de modelado, solamente se puede usar una única cláusula de un grupo específico para definir una columna. Puede definir varias marcas de modelado para una columna.

Para obtener una lista de los tipos de datos, tipos de contenido, distribuciones de columnas y marcas de modelado que puede usar en la definición de una columna, vea los siguientes temas:

Puede agregar una cláusula a la instrucción para describir la relación existente entre dos columnas. Analysis Services admite el uso de la siguiente <cláusula de relación> Column.

RELACIONADO CON
Este formulario indica una jerarquía de valores. El destino de una columna RELATED TO puede ser una columna de clave de una tabla anidada, una columna de valores discretos en la fila de caso u otra columna con una cláusula RELATED TO, que indica una jerarquía de más niveles.

Use una cláusula de predicción para describir el uso de la columna de predicción. La siguiente tabla describe las dos cláusulas posibles.

<cláusula prediction> Descripción
PREDICT Esta columna puede predecirla el modelo y puede proporcionarse en casos de entrada para predecir el valor de otras columnas de predicción.
PREDICT_ONLY Esta columna puede predecirla el modelo, pero sus valores no se pueden utilizar en escenarios de entrada para predecir el valor de otras columnas de predicción.

Lista de definiciones de parámetros

Puede usar la lista de parámetros para ajustar el rendimiento y la funcionalidad de un modelo de minería de datos. La sintaxis de la lista de parámetros es:

[<parameter> = <value>, <parameter> = <value>,...]  

Para obtener una lista de los parámetros asociados a cada algoritmo, consulte Algoritmos de minería de datos (Analysis Services - Minería de datos).

Comentarios

Si desea crear un modelo que tenga un conjunto de datos de pruebas integrado, debe utilizar la instrucción CREATE MINING STRUCTURE seguida de ALTER MINING STRUCTURE. Sin embargo, no todos los tipos de modelo admiten un conjunto de datos de exclusiones. Para obtener más información, vea CREATE MINING STRUCTURE (DMX).

Para ver un tutorial sobre cómo crear un modelo de minería de datos mediante la instrucción CREATEMODEL, vea Time Series Prediction DMX Tutorial.

Ejemplo de Bayes naive

En el ejemplo siguiente se usa el algoritmo Bayes naive de Microsoft para crear un nuevo modelo de minería de datos. La columna Bike Buyer se define como atributo de predicción.

CREATE MINING MODEL [NBSample]  
(  
    CustomerKey LONG KEY,   
    Gender TEXT DISCRETE,  
    [Number Cars Owned] LONG DISCRETE,  
    [Bike Buyer] LONG DISCRETE PREDICT  
)  
USING Microsoft_Naive_Bayes  

Ejemplo de modelo de asociación

En el ejemplo siguiente se usa el algoritmo de asociación de Microsoft para crear un nuevo modelo de minería de datos. La instrucción aprovecha la capacidad de usar una columna de tabla para anidar tablas dentro de la definición de modelo. El modelo se modifica mediante los parámetros MINIMUM_PROBABILITY y MINIMUM_SUPPORT .

CREATE MINING MODEL MyAssociationModel (  
    OrderNumber TEXT KEY,  
    [Products] TABLE PREDICT (  
        [Model] TEXT KEY  
    )  
)  
USING Microsoft_Association_Rules (Minimum_Probability = 0.1, MINIMUM_SUPPORT = 0.01)  

Ejemplo de agrupación en clústeres de secuencia

En el ejemplo siguiente se usa el algoritmo de agrupación en clústeres de secuencia de Microsoft para crear un nuevo modelo de minería de datos. Se usan dos claves para definir el modelo. La columna OrderNumber se utiliza como clave de caso y especifica los pedidos individuales. La columna LineNumber se utiliza como clave de tabla anidada y especifica la secuencia en la que los artículos se agregaron a un pedido.

CREATE MINING MODEL BuyingSequence (  
    [Order Number] TEXT KEY,  
    [Products] TABLE   
     (  
        [Line Number] LONG KEY SEQUENCE,  
        [Model] TEXT DISCRETE PREDICT  
    )  
)  
USING Microsoft_Sequence_Clustering  

Ejemplo de serie temporal

En el ejemplo siguiente se usa el algoritmo De serie temporal de Microsoft para crear un nuevo modelo de minería de datos mediante el algoritmo ARTxp. ReportingDate es la columna de clave de la serie temporal y ModelRegion es la columna de clave de la serie de datos. En este ejemplo, se supone que la periodicidad de los datos es cada 12 meses. Por lo tanto, el parámetro PERIODICITY_HINT se establece en 12.

Nota:

Debe especificar el parámetro PERIODICITY_HINT mediante caracteres de llave. Además, dado que el valor es una cadena, debe incluirse entre comillas simples: "{<valor> numérico}".

CREATE MINING MODEL SalesForecast (  
        ReportingDate DATE KEY TIME,  
        ModelRegion TEXT KEY,  
        Amount LONG CONTINUOUS PREDICT,  
        Quantity LONG CONTINUOUS PREDICT  
)  
USING Microsoft_Time_Series (PERIODICITY_HINT = '{12}', FORECAST_METHOD = 'ARTXP')  

Consulte también

Instrucciones de definición de datos de extensiones de minería de datos (DMX)
Instrucciones de manipulación de datos de extensiones de minería de datos (DMX)
Referencia de instrucciones de Extensiones de minería de datos (DMX)