Condividi tramite


Esplorazione del modello Decision Trees (Esercitazione di base sul data mining)

L'algoritmo Microsoft Decision Trees stima quali colonne influiscono sulla decisione di acquistare una bicicletta in base alle colonne rimanenti nel set di training.

Scheda Albero delle decisioni

Nella scheda Albero delle decisioni è possibile visualizzare alberi delle decisioni per ogni attributo prevedibile nel set di dati.

In questo caso, il modello stima solo una colonna, Bike Buyer, quindi esiste solo un albero da visualizzare. Se ci sono più alberi, è possibile usare la casella Albero per scegliere un altro albero.

Quando si visualizza il TM_Decision_Tree modello nel visualizzatore albero delle decisioni, è possibile visualizzare gli attributi più importanti sul lato sinistro del grafico. "Più importante" significa che questi attributi hanno la maggiore influenza sul risultato. Gli attributi nelle posizioni più basse dell'albero (a destra del grafico) hanno un minor effetto.

In questo esempio, l'età è il fattore più importante, nonché l'unico, nella stima dell'acquisto di biciclette. Il modello raggruppa i clienti in base all'età e quindi visualizza l'attributo più importante successivo per ogni fascia di età. Ad esempio, nel gruppo di clienti in età compresa tra 34 e 40 anni, il numero di automobili possedute è il criterio di stima più importante dopo l'età.

Per esplorare il modello nella scheda Albero delle decisioni

  1. Selezionare la scheda Visualizzatore modelli di data mining in Data Mining Designer.

    Per impostazione predefinita, la finestra di progettazione apre il primo modello aggiunto alla struttura, in questo caso TM_Decision_Tree.

  2. Utilizzare i pulsanti a forma di lente di ingrandimento per regolare le dimensioni della visualizzazione dell'albero.

    Per impostazione predefinita, Microsoft Tree Viewer mostra solo i primi tre livelli dell'albero. Se l'albero contiene meno di tre livelli, il visualizzatore visualizza solo i livelli esistenti. È possibile visualizzare più livelli usando il dispositivo di scorrimento Mostra livello o l'elenco Espansione predefinito .

  3. Diapositiva Mostra livello alla quarta barra.

  4. Modificare il valore Background in 1.

    Modificando l'impostazione Background , è possibile visualizzare rapidamente il numero di case in ogni nodo con il valore di destinazione di 1 [Bike Buyer]. In questo particolare scenario ogni case rappresenta un cliente. Il valore indica che il cliente ha acquistato in precedenza una bicicletta; il valore 10 indica che il cliente non ha acquistato una bicicletta. Quanto più scura appare l'ombreggiatura del nodo, tanto più alta sarà la percentuale di case nel nodo che presentano il valore di destinazione.

  5. Posizionare il cursore sul nodo etichettato Tutto. Nella descrizione comando corrispondente verranno visualizzate le seguenti informazioni:

    • Numero totale di case

    • Numero di case relativi ai non acquirenti di biciclette

    • Numero di case relativi agli acquirenti di biciclette

    • Numero di case con valori mancanti per [Bike Buyer]

    In alternativa, posizionare il cursore su un nodo qualsiasi dell'albero per visualizzare la condizione necessaria per raggiungere tale nodo dal nodo precedente. È anche possibile visualizzare queste stesse informazioni nella legenda di data mining.

  6. Fare clic sul nodo per Age >=34 e < 41. L'istogramma viene visualizzato come una barra orizzontale sottile sul nodo e rappresenta la distribuzione dei clienti in questa fascia di età che hanno (rosa) e non hanno acquistato (blu) una bicicletta. Il visualizzatore indica che i clienti di età compresa tra 34 e 40 anni non automuniti o proprietari di una sola auto acquisteranno probabilmente una bicicletta. È inoltre possibile constatare che la probabilità di acquistare una bicicletta aumenta se il cliente è di età compresa tra 38 e 40 anni.

Poiché al momento della creazione della struttura e del modello è stato abilitato il drill-through, è possibile recuperare informazioni dettagliate dai case del modello e dalla struttura di data mining, comprese le colonne non incluse nel modello di data mining (ad esempio emailAddress, FirstName).

Per altre informazioni, vedere Query drill-through (data mining).

Per eseguire il drill-through sui dati dei case

  1. Fare clic con il pulsante destro del mouse su un nodo e scegliere Drill-Through e quindi Solo colonne modello.

    I dettagli relativi a ogni case di training vengono visualizzati in formato foglio di calcolo. Tali dettagli provengono dalla vista vTargetMail selezionata come tabella del case durante la compilazione della struttura di data mining.

  2. Fare clic con il pulsante destro del mouse su un nodo e scegliere Drill-Through , quindi Modello e Colonne struttura.

    Verrà visualizzato lo stesso foglio di calcolo con le colonne della struttura aggiunte alla fine.

Scheda Rete di dipendenze

Nella scheda Rete dipendenze vengono visualizzate le relazioni tra gli attributi che contribuiscono alla capacità predittiva del modello di data mining. Il Visualizzatore rete di dipendenze consolida il concetto dedotto dai risultati ottenuti, in base al quale l'età e l'area geografica sono fattori importanti nella stima dell'acquisto di biciclette.

Per esplorare il modello nella scheda Rete di dipendenze
  1. Fare clic sul Bike Buyer nodo per identificare le relative dipendenze.

    Il nodo centrale per la rete di dipendenza, Bike Buyer, rappresenta l'attributo stimabile nel modello di data mining. Il grafico evidenzia tutti i nodi collegati che hanno un effetto sull'attributo stimabile.

  2. Modificare il dispositivo di scorrimento Tutti i collegamenti per identificare l'attributo più influente.

    Quando si trascina il dispositivo di scorrimento, gli attributi che hanno solo un effetto debole sulla colonna [Bike Buyer] vengono rimossi dal grafico. Se si sposta il dispositivo di scorrimento è possibile verificare che l'età e l'area di residenza costituiscono i fattori principali per stimare se una persona è un acquirente di biciclette.

Per esplorare i dati utilizzando gli altri tipi di modelli, vedere gli argomenti seguenti.

Attività successiva della lezione

Esplorazione del modello di clustering (Esercitazione di base sul data mining)

Vedere anche

Attività e procedure relative al visualizzatore modello di data mining
Scheda Albero delle decisioni (Visualizzatore modello di data mining)
Scheda Rete di dipendenze (Visualizzatore modello di data mining)
Visualizzare un modello utilizzando il Visualizzatore Microsoft Decision Trees