Condividi tramite


Lezione 2: Aggiunta di modelli di data mining alla struttura di data mining Market Basket

In questa lezione verranno aggiunti due modelli di data mining alla struttura di data mining Market Basket creata nella lezione 1: Creazione della struttura di data mining Market Basket. Questi modelli di data mining consentiranno di creare stime.

Per stimare i tipi di prodotti che i clienti tendono ad acquistare contemporaneamente, verranno creati due modelli di data mining usando Microsoft Association Algorithm e due valori diversi per il parametro MINIMUM_PROBABILTY .

MINIMUM_PROBABILTY è un parametro dell'algoritmo Microsoft Association che consente di determinare il numero di regole che un modello di data mining conterrà specificando la probabilità minima che una regola deve avere. Ad esempio, l'impostazione di questo valore su 0,4 specifica che una regola può essere generata solo se la combinazione di prodotti che la regola descrive ha una probabilità di realizzazione di almeno il 40%.

Verrà visualizzato l'effetto della modifica del parametro MINIMUM_PROBABILTY in una lezione successiva.

Istruzione ALTER MINING STRUCTURE

Per aggiungere un modello di data mining contenente una tabella nidificata a una struttura di data mining, utilizzare l'istruzione ALTER MINING STRUCTURE (DMX). Il codice nell'istruzione può essere suddiviso nelle parti seguenti:

  • Identificazione della struttura di data mining

  • Denominazione del modello di data mining

  • Definizione della colonna chiave

  • Definizione della colonna di input e della colonna stimabile

  • Definizione delle colonne della tabella nidificata

  • Identificazione delle modifiche a livello di algoritmo e parametri

Gli elementi seguenti sono un esempio generico dell'istruzione ALTER MINING STRUCTURE, che consente di aggiungere un modello di data mining a una struttura che include colonne delle tabelle nidificate:

ALTER MINING STRUCTURE [<Mining Structure Name>]  
ADD MINING MODEL [<Mining Model Name>]  
(  
    [<key column>],  
    <mining model column> <usage>,  
    <table columns>  
    (  [<nested key column>],  
       <nested mining model columns> )  
) USING <algorithm>( <algorithm parameters> )  

La prima riga del codice identifica la struttura di data mining esistente a cui verrà aggiunto il modello di data mining:

ALTER MINING STRUCTURE [<mining structure name>]  

La riga successiva del codice indica il nome del modello di data mining che verrà aggiunto alla struttura di data mining:

ADD MINING MODEL [<mining model name>]  

Per informazioni sulla denominazione di un oggetto in DMX (Data Mining Extensions), vedere Identificatori (DMX).

Le successive righe del codice definiscono le colonne della struttura di data mining che verranno utilizzate dal modello di data mining:

[<key column>],  
<mining model columns> <usage>,  

È possibile utilizzare solo colonne che esistono già nella struttura di data mining.

La prima colonna nell'elenco delle colonne del modello di data mining deve essere la colonna chiave nella struttura di data mining. Non è tuttavia necessario digitare KEY dopo la colonna chiave per specificare l'utilizzo. Ciò avviene perché la colonna è già stata definita come colonna chiave al momento della creazione della struttura di data mining.

Le righe rimanenti specificano l'utilizzo delle colonne nel nuovo modello di data mining. Per specificare che una colonna nel modello di data mining verrà utilizzata per la stima, è possibile utilizzare la sintassi seguente:

<column name> PREDICT,  

Se non viene specificato l'utilizzo, non è necessario includere una colonna della struttura di data mining nell'elenco. Tutte le colonne utilizzate dalla struttura di data mining di riferimento sono automaticamente disponibili per l'utilizzo da parte dei modelli di data mining basati su tale struttura. Tuttavia, il modello non utilizzerà le colonne per il training a meno che non venga specificato l'utilizzo.

L'ultima riga del codice definisce l'algoritmo e i parametri dell'algoritmo che verranno utilizzati per generare il modello di data mining.

) USING <algorithm>( <algorithm parameters> )  

Argomenti della lezione

In questa lezione verranno eseguite le attività seguenti:

  • Aggiunta di un modello di data mining di associazione alla struttura utilizzando il valore di probabilità predefinito

  • Aggiunta di un modello di data mining di associazione alla struttura utilizzando un valore di probabilità modificato

Aggiunta di un modello di data mining di associazione alla struttura utilizzando il valore predefinito di MINIMUM_PROBABILITY

La prima attività consiste nell'aggiungere un nuovo modello di data mining alla struttura di data mining Market Basket in base all'algoritmo Microsoft Association usando il valore predefinito per MINIMUM_PROBABILITY.

Per aggiungere un modello di data mining di associazione

  1. In Esplora oggetti fare clic con il pulsante destro del mouse sull'istanza di Analysis Services, scegliere Nuova query e quindi fare clic su DMX.

    Verrà avviato l'editor di query con una nuova query vuota.

    Nota

    Per creare una query DMX su un database di Analysis Services specifico, fare clic con il pulsante destro del mouse sul database anziché sull'istanza di .

  2. Copiare l'esempio generico dell'istruzione ALTER MINING STRUCTURE nella query vuota.

  3. Sostituire quanto segue:

    <mining structure name>   
    

    con:

    [Market Basket]  
    
  4. Sostituire quanto segue:

    <mining model name>   
    

    con:

    [Default Association]  
    
  5. Sostituire quanto segue:

    [<key column>],  
    <mining model columns>,  
    <table columns>  
    (  [<nested key column>],  
       <nested mining model columns> )  
    

    con:

    OrderNumber,  
        [Products] PREDICT (  
            [Model]  
        )  
    

    In questo caso, la tabella [Products] è stata definita come colonna stimabile. Inoltre, la colonna [Model] è inclusa nell'elenco delle colonne della tabella nidificata, poiché è la colonna chiave della tabella nidificata.

    Nota

    Tenere presente che una chiave nidificata è diversa da una chiave del case. Una chiave del case è un identificatore univoco del case, mentre la chiave nidificata è un attributo che si desidera modellare.

  6. Sostituire quanto segue:

    USING <algorithm>( <algorithm parameters> )  
    

    con:

    Using Microsoft_Association_Rules  
    

    L'istruzione risultante dovrebbe essere la seguente:

    ALTER MINING STRUCTURE [Market Basket]  
    ADD MINING MODEL [Default Association]  
    (  
        OrderNumber,  
        [Products] PREDICT (  
            [Model]  
        )  
    )  
    Using Microsoft_Association_Rules  
    
  7. Scegliere Salva DMXQuery1.dmx Con nome dal menu File.

  8. Nella finestra di dialogo Salva con nome passare alla cartella appropriata e assegnare al file Default_Association_Model.dmxil nome .

  9. Sulla barra degli strumenti fare clic sul pulsante Esegui .

Aggiunta di un modello di data mining di associazione alla struttura modificando il valore predefinito di MINIMUM_PROBABILITY

L'attività successiva consiste nell'aggiungere un nuovo modello di data mining alla struttura di data mining Market Basket in base all'algoritmo Microsoft Association e modificare il valore predefinito per MINIMUM_PROBABILITY impostarlo su 0,01. La modifica del parametro causerà la creazione di altre regole da parte dell'algoritmo Microsoft Association.

Per aggiungere un modello di data mining di associazione

  1. In Esplora oggetti fare clic con il pulsante destro del mouse sull'istanza di Analysis Services, scegliere Nuova query e quindi fare clic su DMX.

    Verrà avviato l'editor di query con una nuova query vuota.

  2. Copiare l'esempio generico dell'istruzione ALTER MINING STRUCTURE nella query vuota.

  3. Sostituire quanto segue:

    <mining structure name>   
    

    con:

    Market Basket  
    
  4. Sostituire quanto segue:

    <mining model name>   
    

    con:

    [Modified Association]  
    
  5. Sostituire quanto segue:

    <mining model columns>,  
    <table columns>  
    (  [<nested key column>],  
       <nested mining model columns> )  
    

    con:

    OrderNumber,  
    [Products] PREDICT (  
            [Model]  
        )  
    

    In questo caso, la tabella [Products] è stata designata come colonna stimabile. Anche la colonna [MODEL] è inclusa nell'elenco perché è la colonna chiave nella tabella nidificata.

  6. Sostituire quanto segue:

    USING <algorithm>( <algorithm parameters> )  
    

    con:

    USING Microsoft_Association_Rules (Minimum_Probability = 0.1)  
    

    L'istruzione risultante dovrebbe essere la seguente:

    ALTER MINING STRUCTURE [Market Basket]  
    ADD MINING MODEL [Modified Assocation]  
    (  
        OrderNumber,  
        [Products] PREDICT (  
            [Model]  
        )  
    )  
    USING Microsoft_Association_Rules (Minimum_Probability = 0.1)  
    
  7. Scegliere Salva DMXQuery1.dmx Con nome dal menu File.

  8. Nella finestra di dialogo Salva con nome passare alla cartella appropriata e assegnare al file Modified Association_Model.dmxil nome .

  9. Sulla barra degli strumenti fare clic sul pulsante Esegui .

Nella lezione successiva verranno elaborati la struttura di data mining Market Basket insieme ai relativi modelli di data mining associati.

Lezione successiva

Lezione 3: Elaborazione della struttura di data mining Market Basket