Condividi tramite


Esplorazione dei modelli Market Basket (Esercitazione sul data mining)

Data aggiornamento: 15 settembre 2007

Dopo aver creato il modello Association, è possibile esaminarlo utilizzando il Visualizzatore Microsoft Association Rules disponibile nella scheda Visualizzatore modello di data mining di Progettazione modelli di data mining. Quando si esplora il modello, è possibile individuare con facilità quali prodotti ricorrono insieme ed esplorare le relazioni tra gli elementi. È anche possibile escludere le associazioni più deboli e ottenere un'idea generale dei modelli emergenti.

Il Visualizzatore Microsoft Association Rules contiene tre schede, ovvero Set di elementi, Regole e Rete di dipendenze. Per ulteriori informazioni su questo visualizzatore, vedere Visualizzazione di un modello di data mining con il Visualizzatore Microsoft Association Rules.

Scheda Set di elementi

Nella scheda Set di elementi vengono visualizzate tre importanti informazioni relative ai set di elementi individuati dall'algoritmo Microsoft Association: il supporto, ovvero il numero di transazioni eseguite nel set di elementi; le dimensioni, ovvero il numero di elementi contenuti nel set di elementi e l'effettiva composizione del set di elementi. L'algoritmo consente di generare un numero esteso di set di elementi a seconda della modalità di impostazione dei parametri. I controlli disponibili nella parte superiore della scheda Set di elementi consentono di filtrare il visualizzatore in modo da mostrare solo i set di elementi contenenti dimensioni e supporto minimi specificati.

È inoltre possibile utilizzare la casella Filtra set di elementi per filtrare i set di elementi disponibili nel visualizzatore. Ad esempio, per visualizzare solo gli elementi contenenti informazioni sulla bicicletta Mountain-200, in Filtra set di elementi immettere Mountain-200. Nel visualizzatore verranno visualizzati solo gli elementi che contengono il testo "Mountain-200". Ogni set di elementi visualizzato contiene informazioni su transazioni relative alla vendita di una bicicletta Mountain-200. Ad esempio, il set di elementi con il valore 710 nella colonna Supporto indica che prendendo in considerazione il totale delle transazioni, 710 persone tra quelle che hanno acquistato una bicicletta Mountain-200 hanno acquistato anche il modello Sport-100.

Scheda Regole

Nella scheda Regole vengono visualizzate le informazioni seguenti relative alle regole individuate dall'algoritmo.

  • Probabilità
    La probabilità che una regola si verifichi.
  • Priorità
    Una misura dell'utilità della regola; un valore maggiore indica una regola migliore. Soffermarsi solo sulla probabilità può essere fuorviante. Ad esempio, se ogni transazione contiene un elemento x, la regola y stimerà che x ha probabilità 1, a indicare che x si verificherà sempre. Sebbene la regola sia molto accurata, le informazioni offerte non sono molte dato che ogni transazione contiene x a prescindere da y.
  • Regola
    La definizione della regola

Analogamente alla scheda Set di elementi, è possibile filtrare le regole in modo da mostrare solo le più interessanti. Ad esempio, per mostrare solo le regole che includono la bicicletta Mountain-200, immettere Mountain-200 nella casella Filtro regola. Verranno visualizzate solo le regole che contengono il testo "Mountain-200". Ogni regola può essere utilizzata per fare previsioni sulla presenza di un elemento in una transazione in base alla presenza di altri elementi. La prima regola, ad esempio, indica che se un cliente acquista una bicicletta Mountain-200 e una bottiglia di acqua, esiste una probabilità pari a 1 che tale cliente acquisti anche un portabottiglie Mountain.

Scheda Rete di dipendenze

La scheda Rete di dipendenze consente di esaminare l'interazione tra i diversi elementi presenti nel modello. Ogni nodo nel visualizzatore rappresenta un elemento; ad esempio, il nodo Mountain-200 = Existing indica che Mountain-200 esiste nella transazione. Selezionando un nodo è possibile utilizzare la legenda dei colori disponibile nella parte inferiore della scheda per verificare quali elementi determinino o siano determinati da altri elementi inclusi nel modello.

Il dispositivo di scorrimento è associato alla probabilità di una regola. Spostare il dispositivo di scorrimento verso l'alto o verso il basso per escludere le associazioni deboli. Ad esempio, nella casella Mostra selezionare Mostra solo il nome dell'attributo e quindi fare clic sul nodo Mountain Bottle Cage. Nel visualizzatore viene evidenziato che il portabottiglie Mountain ha un rapporto di causalità sia con la bottiglia di acqua che con la bicicletta Mountain-200. Ciò significa che è probabile che questi elementi compaiano insieme in una transazione. In altre parole, se un cliente acquista una bicicletta è probabile che acquisti anche una bottiglia d'acqua e un portabottiglie.

Lezione successiva

Lezione 5: Creazione dello scenario relativo al clustering delle sequenze