Condividi tramite


Lezione 3: Elaborazione della struttura di data mining Bike Buyer

In questa lezione verranno utilizzate l'istruzione INSERT INTO e la vista vTargetMail del database di esempio AdventureWorksDW2008R2 per elaborare le strutture e i modelli di data mining creati nella Lezione 1: Creazione della struttura di data mining Bike Buyer e nella Lezione 2: Aggiunta di modelli di data mining alla struttura di data mining Bike Buyer.

Quando si elabora una struttura di data mining, Analysis Services legge i dati di origine e compila le strutture che supportano i modelli di data mining. Quando si elabora un modello di data mining, i dati definiti dalla struttura di data mining vengono elaborati tramite l'algoritmo di data mining selezionato. L'algoritmo ricerca tendenze e schemi e quindi archivia queste informazioni nel modello di data mining. Il modello di data mining non contiene pertanto i dati di origine effettivi, bensì le informazioni individuate dall'algoritmo. Per ulteriori informazioni sull'elaborazione dei modelli di data mining, vedere Elaborazione di oggetti di data mining.

Una struttura di data mining deve essere rielaborata solo se si modifica una colonna della struttura o i dati di origine. Se si aggiunge un modello di data mining a una struttura di data mining già elaborata, è possibile utilizzare l'istruzione INSERT INTO MINING MODEL per eseguire il training del nuovo modello di data mining.

Training del modello di struttura

Per eseguire il training della struttura di data mining e dei modelli di data mining associati, utilizzare l'istruzione INSERT INTO (DMX). Il codice nell'istruzione può essere suddiviso nelle parti seguenti:

  • Identificazione della struttura di data mining

  • Creazione di un elenco delle colonne nella struttura di data mining

  • Definizione dei dati di training

Di seguito è riportato un esempio generico dell'istruzione INSERT INTO:

INSERT INTO MINING STRUCTURE [<mining structure name>]
(
   <mining structure columns>
)
OPENQUERY([<datasource>],'<SELECT statement>')

La prima riga del codice identifica la struttura di data mining di cui si eseguirà il training:

INSERT INTO MINING STRUCTURE [<mining structure name>]

La riga successiva del codice specifica le colonne definite dalla struttura di data mining. È necessario che siano elencate tutte le colonne nella struttura di data mining e ogni colonna deve essere associata a una colonna nei dati della query di origine.

(
   <mining structure columns>
)

L'ultima riga del codice definisce i dati che verranno utilizzati per il training della struttura di data mining.

OPENQUERY([<datasource>],'<SELECT statement>')

In questa lezione si utilizzerà OPENQUERY per definire i dati di origine. Per informazioni su altri metodi per la definizione della query di origine, vedere <source data query>.

Argomenti della lezione

In questa lezione verrà eseguita l'attività seguente:

  • Elaborazione della struttura di data mining Bike Buyer

Elaborazione della struttura di data mining predittiva

Per elaborare la struttura di data mining mediante INSERT INTO

  1. In Esplora oggetti fare clic con il pulsante destro del mouse sull'istanza di Analysis Services, scegliere Nuova query e quindi DMX.

    Verrà avviato l'editor di query con una nuova query vuota.

  2. Copiare l'esempio generico dell'istruzione INSERT INTO nella query vuota.

  3. Sostituire quanto segue:

    [<mining structure name>] 
    

    con:

    Bike Buyer
    
  4. Sostituire quanto segue:

    <mining structure columns>
    

    con:

    [Customer Key],
    [Age],
    [Bike Buyer],
    [Commute Distance],
    [Education],
    [Gender],
    [House Owner Flag],
    [Marital Status],
    [Number Cars Owned],
    [Number Children At Home],
    [Occupation],
    [Region],
    [Total Children],
    [Yearly Income]
    
  5. Sostituire quanto segue:

    OPENQUERY([<datasource>],'<SELECT statement>')
    

    con:

    OPENQUERY([Adventure Works DW2008R2],
       'SELECT CustomerKey, Age, BikeBuyer,
             CommuteDistance,EnglishEducation,
             Gender,HouseOwnerFlag,MaritalStatus,
             NumberCarsOwned,NumberChildrenAtHome, 
             EnglishOccupation,Region,TotalChildren,
             YearlyIncome 
        FROM dbo.vTargetMail')
    

    L'istruzione OPENQUERY fa riferimento all'origine dati Adventure Works DW2008R2 per accedere alla vista vTargetMail che contiene i dati di origine che verranno utilizzati per il training dei modelli di data mining.

    L'istruzione completa dovrebbe risultare analoga alla seguente:

    INSERT INTO MINING STRUCTURE [Bike Buyer]
    (
       [Customer Key],
       [Age],
       [Bike Buyer],
       [Commute Distance],
       [Education],
       [Gender],
       [House Owner Flag],
       [Marital Status],
       [Number Cars Owned],
       [Number Children At Home],
       [Occupation],
       [Region],
       [Total Children],
       [Yearly Income]   
    )
    OPENQUERY([Adventure Works DW2008R2],
       'SELECT CustomerKey, Age, BikeBuyer,
             CommuteDistance,EnglishEducation,
             Gender,HouseOwnerFlag,MaritalStatus,
             NumberCarsOwned,NumberChildrenAtHome, 
             EnglishOccupation,Region,TotalChildren,
             YearlyIncome 
        FROM dbo.vTargetMail')
    
  6. Scegliere Salva DMXQuery1.dmx con nome dal menu File.

  7. Nella finestra di dialogo Salva con nome individuare la cartella appropriata e assegnare al file il nome Process Bike Buyer Structure.dmx.

  8. Fare clic sul pulsante Esegui sulla barra degli strumenti.

Nella lezione successiva verrà esplorato il contenuto dei modelli di data mining aggiunti alla struttura di data mining in questa lezione.