Condividi tramite


Esplorazione del modello di previsione (Esercitazione intermedia sul data mining)

Dopo avere compilato il modello di data mining Forecasting, è possibile esaminare i risultati utilizzando la scheda Visualizzatore modello di data mining di Progettazione modelli di data mining. Il Visualizzatore Microsoft Time Series contiene due schede: Grafici e Modello.

Il modello di data mining Forecasting compilato descrive le vendite di prodotti in tre diverse aree, ovvero Europe (Europa), North America (America del nord) e Pacific (Pacifico), per gli anni 2005-2010. Di conseguenza, l'algoritmo Microsoft Time Series crea un modello Time Series che contiene più alberi, ognuno dei quali include una diversa combinazione di area, prodotto e attributo stimabile.

Ognuna delle schede del visualizzatore offre una vista diversa delle informazioni nel modello Time Series completo.

  • Scheda Grafici

  • Scheda Modello

  • Generic Content Tree Viewer

Scheda Grafici

La scheda Grafici del Visualizzatore Microsoft Time Series mostra graficamente ciascuno degli alberi creati dall'algoritmo. Un albero di serie temporali contiene una combinazione univoca di prodotto, area e attributo stimabile.

Nella legenda a destra nella finestra del visualizzatore vengono elencate le serie temporali selezionate nell'elenco a discesa e le rispettive caselle di controllo. È possibile scegliere le serie temporali da visualizzare selezionando o deselezionando le caselle di controllo nella legenda.

È inoltre possibile modificare le opzioni di visualizzazione, quali i colori utilizzati per ogni serie temporale, o decidere se visualizzare i valori in qualsiasi punto del grafico.

Per selezionare una serie temporale

  1. Fare clic sulla scheda Grafici della scheda Visualizzatore modello di data mining, se non è già visualizzata.

  2. Fare clic sull'elenco a discesa a destra della vista del grafico e selezionare tutte le caselle di controllo. Il grafico dovrebbe contenere 24 linee delle serie.

  3. Fare clic su OK.

  4. Nelle caselle di controllo a destra del grafico deselezionare le caselle per nascondere temporaneamente le linee per tutte le serie basate sull'importo.

  5. A questo punto deselezionare le caselle di controllo relative alle biciclette R750 e R250.

    Il grafico conterrà solo le sei linee delle serie seguenti, in modo da consentire di confrontare più facilmente le tendenze per le biciclette M200 e T1000.

    • M200 Europe: Quantity

    • M200 North America: Quantity

    • M200 Pacific: Quantity

    • T1000 Europe: Quantity

    • T1000 North America: Quantity

    • T1000 Pacific: Quantity

Serie per la stima delle quantità M200 e T1000Serie per la stima delle quantità M200 e T1000

Nel grafico vengono visualizzati sia i dati cronologici che i dati stimati. Ai dati stimati viene applicata un'ombreggiatura per distinguerli dai dati cronologici. Per rendere più semplice confrontare serie differenti, è anche possibile modificare i colori associati a ogni linea nel grafico. Per ulteriori informazioni, vedere Procedura: Modifica dei colori utilizzati nei visualizzatori data mining.

Le linee di tendenza mostrano che in genere le vendite totali per tutte le aree sono in aumento e raggiungono il periodo di picco ogni anno nel mese di dicembre. Le stime in genere confermano questa tendenza. Nel grafico viene inoltre evidenziato che i dati per la bicicletta T1000 hanno inizio molto più tardi dei dati per le altre serie di prodotti.

Per impostazione predefinita, Analysis Services mostra cinque intervalli per la stima per ogni serie temporale. È possibile modificare questo valore in modo da visualizzare un numero maggiore o minore di intervalli per la stima. È anche possibile visualizzare graficamente la deviazione standard per la stima aggiungendo barre di errore al grafico.

Per modificare le opzioni relative a stima e visualizzazione nella vista del grafico

  1. Modificare gradualmente il valore di Intervalli per la stima da 5 a 10, quindi tornare a 6.

    Nota

    Nelle linee di tendenza con grandi fluttuazioni nei dati cronologici le fluttuazioni vengono amplificate durante la stima.

  2. Selezionare la casella di controllo Mostra deviazioni.

  3. Posizionare il mouse sulle barre di errore per la serie M200.

  4. Posizionare il mouse sulle barre di errore per la serie T1000 Pacific.

Questi risultati verranno utilizzati per eseguire un'analisi più approfondita. In un secondo momento si svilupperà un modello basato sulla media di tutte le aree e, pertanto, meno soggetto a fluttuazione.

Torna all'inizio

Scheda Modello

La scheda Modello del Visualizzatore Microsoft Time Series in Progettazione modelli di data mining consente di visualizzare la serie temporale come grafico dell'albero decisionale. Un albero distinto viene calcolato per ogni serie inclusa nel modello. In un modello della serie temporale il grafico dell'albero delle decisioni potrebbe includere un solo nodo, se la serie temporale è lineare, oppure diversi nodi e condizioni associati a ogni ramo, come un normale albero delle decisioni.

I nodi nel grafico dell'albero decisionale per una serie temporale contengono alcune delle seguenti informazioni:

  • La concentrazione di case per lo stato dell'attributo stimabile specificato nel controllo Sfondo. La finestra Legenda data mining e la descrizione comando visualizzata quando si posiziona il mouse su un oggetto dell'albero riportano il numero esatto di case.

  • La formula di regressione del nodo. La formula di regressione ARTXP è disponibile solo nei nodi foglia. L'equazione ARIMA è disponibile nel nodo radice dell'albero.

  • Un grafico a rombi che rappresenta l'intervallo dell'attributo. Il rombo è posizionato nel punto intermedio del nodo e la sua larghezza rappresenta la varianza dell'attributo su tale nodo.

Per visualizzare l'albero delle decisioni per un modello della serie temporale

  1. Nell'elenco Albero della scheda Modello del visualizzatore selezionare la serie M200 North America: Amount.

    Nel grafico viene visualizzato un solo nodo.

  2. Posizionare il cursore del mouse sul nodo.

    Per un nodo Tutti, la descrizione comando visualizzata include informazioni quali il numero di casi nell'intera serie e le equazioni della serie temporale derivate dall'analisi dei dati.

  3. Fare clic sul nodo e visualizzare Legenda data mining.

    Legenda data mining include informazioni simili a quelle nella descrizione comando, ma fornisce ulteriori dettagli, tra cui un istogramma dei valori.

  4. Nell'elenco Albero della scheda Modello del visualizzatore selezionare la serie M200 Pacific: Amount.

    Il grafico dell'albero ora conterrà un nodo Tutti e due nodi figlio. Il testo nei nodi figlio descrive le condizioni che suddividono l'albero.

  5. Posizionare il cursore del mouse su uno dei nodi figlio ed esaminare il contenuto della descrizione comando. In alternativa, fare clic sul nodo e visualizzare Legenda data mining.

    Per i nodi figlio, la descrizione include il conteggio dei case in ogni ramo dell'albero e qualsiasi condizione aggiuntiva che ha causato la suddivisione dell'albero.

Torna all'inizio

Generic Content Tree Viewer

Oltre al visualizzatore personalizzato per la serie temporale, Analysis Services fornisce MicrosoftGeneric Content Tree Viewer. Questo visualizzatore può essere utilizzato per tutti i modelli di data mining, indipendentemente dall'algoritmo utilizzato. Generic Content Tree Viewer è disponibile dall'elenco a discesa Visualizzatore.

In questo visualizzatore ogni modello di data mining, indipendentemente dai dati o dall'algoritmo in uso per l'analisi, viene rappresentato come un albero che contiene una serie di nodi. Ogni nodo rappresenta informazioni relative a un subset di dati. Il contenuto esatto del nodo differisce a seconda dell'algoritmo e del tipo di attributo stimabile, ma lo schema generale del contenuto è lo stesso.

Poiché il modello di data mining creato è un modello misto, che combina entrambi gli algoritmi ARTXP e ARIMA, Analysis Services utilizza ogni algoritmo per creare modelli ARTXP e ARIMA distinti per ogni serie temporale. Quando si utilizza il Visualizzatore Microsoft Time Series per esplorare il modello di data mining Forecasting, Analysis Services combina i risultati dei due algoritmi e mostra il modello di data mining come un singolo albero, in ogni nodo del quale sono inclusi alcuni contenuti da entrambi gli algoritmi.

Tuttavia, quando si utilizza MicrosoftGeneric Content Tree Viewer, il contenuto generato da ogni algoritmo viene esposto come due tipi diversi di nodi all'interno del modello di data mining Forecasting. È possibile eseguire il drill-down tramite la versione ARTXP o la versione ARIMA del modello per aumentare il livello di dettaglio.

Per visualizzare i dettagli per una particolare serie di dati in Generic Content Tree Viewer

  1. Nella scheda Visualizzatore modello di data mining selezionare Microsoft Generic Content Tree Viewer dall'elenco a discesa Visualizzatore.

  2. Nel riquadro Didascalia nodo fare clic sul nodo (Tutti) superiore.

  3. Nel riquadro Dettagli nodo esaminare il valore ATTRIBUTE_NAME.

    Questo valore indica quale serie, o combinazione di prodotto e area, è contenuta nel nodo. Nell'esempio di AdventureWorks il nodo superiore è relativo alla serie M200 Europe.

  4. Nel riquadro Didascalia nodo individuare il primo nodo che dispone di nodi figlio.

    Se un nodo della serie dispone di figli, anche la visualizzazione albero contenuta nella scheda Modello del Visualizzatore Microsoft Time Series disporrà di una struttura con rami.

  5. Espandere il nodo e fare clic su uno dei nodi figlio.

    La colonna NODE_DESCRIPTION dello schema contiene la condizione che ha causato la suddivisione dell'albero.

  6. Nel riquadro Didascalia nodo fare clic sul nodo ARIMA superiore ed espanderlo fino a visualizzare tutti i nodi figlio.

  7. Nel riquadro Dettagli nodo esaminare il valore ATTRIBUTE_NAME.

    Questo valore indica quale serie temporale è contenuta nel nodo. Il nodo superiore nella sezione ARIMA deve corrispondere al nodo superiore nella sezione (Tutti). Nell'esempio di AdventureWorks questo nodo contiene l'analisi ARIMA relativa alla serie M200 Europe.

Per ulteriori informazioni, vedere Contenuto dei modelli di data mining per i modelli Time Series (Analysis Services - Data mining).

Torna all'inizio