Condividi tramite


Creazione di una struttura del modello di data mining Sequence Clustering (Esercitazione intermedia sul data mining)

Il primo passaggio della creazione di un modello di data mining di clustering sequenza consiste nell'usare la Creazione guidata data mining per creare una nuova struttura di data mining e un modello di data mining basato sull'algoritmo Microsoft Sequence Clustering.

Verrà utilizzata la stessa vista origine dati impiegata per l'analisi degli acquisti, ma si aggiungerà una colonna che contiene l'identificatore sequence. In questo scenario la sequenza indica l'ordine in cui il cliente ha incluso gli articoli tra gli acquisti.

Verranno anche aggiunte alcune colonne utilizzate in uno dei modelli per raggruppare i clienti in base ai dati demografici.

Per creare una struttura e un modello di data mining Sequence Clustering

  1. In Esplora soluzioni in SQL Server Data Tools (SSDT), fare clic con il pulsante destro del mouse su Strutture di data mining e scegliere Nuova struttura di data mining.

  2. Nella pagina iniziale Creazione guidata modello di data mining fare clic su Avanti.

  3. Nella pagina Selezionare il metodo di definizione verificare che dal database relazionale esistente o dal data warehouse sia selezionato e quindi fare clic su Avanti.

  4. Nella pagina Crea struttura di data mining verificare che sia selezionata l'opzione Crea struttura di data mining con un modello di data mining . Fare quindi clic sull'elenco a discesa per l'opzione Quale tecnica di data mining usare?e selezionare Microsoft Sequence Clustering. Fare clic su Avanti.

    Verrà visualizzata la pagina Seleziona visualizzazione origine dati . In Viste origine dati disponibili selezionare Orders.

    Orders è la stessa vista origine dati utilizzata per lo scenario di analisi degli acquisti. Se questa vista origine dati non è stata creata, vedere Aggiunta di una vista origine dati con tabelle nidificate (esercitazione sul data mining intermedio).

  5. Fare clic su Avanti.

  6. Nella pagina Specifica tipi di tabella selezionare la casella di controllo Case accanto alla tabella vAssocSeqOrders e selezionare la casella di controllo Annidata accanto alla tabella vAssocSeqLineItems . Fare clic su Avanti.

    Nota

    Se si verifica un errore quando si selezionano le caselle di controllo Case o Nested , potrebbe essere che il join nella visualizzazione origine dati non sia corretto. La tabella annidata, vAssocSeqLineItems, deve essere connessa alla tabella case, vAssocSeqOrders, da un join molti-a-uno. È possibile modificare la relazione facendo clic con il pulsante destro del mouse sulla linea di join e invertendo la direzione del join. Per altre informazioni, vedere Creare o modificare la finestra di dialogo Relazione (Analysis Services - Dati multidimensionali).

  7. Nella pagina Specificare i dati di training scegliere le colonne da usare nel modello selezionando una casella di controllo come indicato di seguito:

    • IncomeGroup Selezionare la casella di controllo Input .

      Questa colonna contiene interessanti informazioni sui clienti che è possibile utilizzare per il clustering. Verranno utilizzate nel primo modello e ignorate nel secondo modello.

    • Ordernumber Selezionare la casella di Key controllo.

      Questo campo sarà utilizzato come identificatore per la tabella del case o Key. In generale, è consigliabile non utilizzare mai il campo chiave della tabella del case come input, perché la chiave contiene valori univoci che non sono utili per il clustering.

    • Regione Selezionare la casella di controllo Input .

      Questa colonna contiene interessanti informazioni sui clienti che è possibile utilizzare per il clustering. Verranno utilizzate nel primo modello e ignorate nel secondo modello.

    • Linenumber Selezionare le caselle di Key controllo e Input .

      Il campo LineNumber verrà usato come identificatore per la tabella annidata o Sequence Key. La chiave di una tabella nidificata deve essere sempre utilizzata per l'input.

    • Modello Selezionare le caselle di controllo Input e Stimabili .

    Verificare che le selezioni siano corrette e quindi fare clic su Avanti.

  8. Nella pagina Specifica contenuto colonne e tipo di dati verificare che la griglia contenga le colonne, i tipi di contenuto e i tipi di dati mostrati nella tabella seguente e quindi fare clic su Avanti.

    Tabelle/Colonne Tipo di contenuto Tipo di dati
    IncomeGroup Discrete Testo
    OrderNumber Chiave Testo
    Region Discrete Testo
    vAssocSeqLineItems
    Line Number Key Sequence long
    Modellare Discrete Testo
  9. Nella pagina Crea set di test modificare la percentuale di dati per il test su 20 e quindi fare clic su Avanti.

  10. Nella pagina Completamento procedura guidata digitare il nome Sequence Clustering with Regiondella struttura di data mining.

  11. Per il nome del modello di data mining digitare Sequence Clustering with Region.

  12. Selezionare la casella Consenti drill-through e quindi fare clic su Fine.

Attività successiva della lezione

Elaborazione del modello Sequence Clustering

Vedere anche

Data Mining Designer
Algoritmo Microsoft Sequence Clustering