Condividi tramite


Creazione di stime basate su serie temporali (Esercitazione intermedia sul data mining)

Nelle attività precedenti di questa lezione è stato creato un modello Time Series e sono stati esplorati i risultati. Per impostazione predefinita, Analysis Services crea sempre un set di cinque (5) stime per un modello time series e visualizza i valori stimati come parte del grafico di previsione. È tuttavia possibile creare previsioni compilando query di stima DMX (Data Mining Extensions).

In questa attività verrà creata una query di stima che genera le stesse stime esaminate in precedenza nel visualizzatore. Questa attività presuppone che siano già state completate le lezioni dell'Esercitazione di base sul data mining e che si abbia familiarità con l'utilizzo del generatore delle query di stima. Verrà ora illustrato come creare query specifiche per i modelli Time Series.

Creazione di stime basate su serie temporali

In genere il primo passaggio per creare una query di stima consiste nel selezionare un modello di data mining e una tabella di input. Tuttavia, un modello Time Series non richiede input aggiuntivi per una stima normale. Non è pertanto necessario specificare una nuova origine dati durante l'esecuzione di stime, a meno che non si aggiungano o sostituiscano dati nel modello.

Ai fini di questa lezione è necessario specificare il numero di intervalli per la stima. È inoltre possibile specificare il nome della serie per ottenere una stima per una determinata combinazione di prodotto e area.

Per selezionare un modello e una tabella di input

  1. Nella scheda Stima modello di data mining della Designer di data mining fare clic su Seleziona modello nella casella Modello di data mining.

  2. Nella finestra di dialogo Seleziona modello di data mining espandere la struttura Previsione, selezionare il modello di previsione dall'elenco e quindi fare clic su OK.

  3. Ignorare la casella Seleziona tabelle di input .

    Nota

    Per i modelli Time Series non è necessario specificare un input distinto, a meno che non si stia eseguendo una stima incrociata.

  4. Nella colonna Origine , nella griglia della scheda Stima modello di data mining fare clic sulla cella nella prima riga vuota e quindi selezionare Previsione modello di data mining.

  5. Nella colonna Campo selezionare Area modello.

    L'identificatore della serie verrà aggiunto alla query di stima per indicare a quale combinazione di modello e area si applica la stima.

  6. Fare clic sulla riga vuota successiva nella colonna Origine e quindi selezionare Funzione di stima.

  7. Nella colonna Campo selezionare PredictTimeSeries.

    Nota

    Con i modelli Time Series è inoltre possibile utilizzare la funzione Predict. Per impostazione predefinita, tuttavia, la funzione Predict crea una sola stima per ogni serie. Pertanto, per specificare più passaggi di stima, è necessario usare la funzione PredictTimeSeries .

  8. Nel riquadro Modello di data mining selezionare la colonna modello di data mining Amount. Trascinare Amount nella casella Criteri/Argomenti per la funzione PredictTimeSeries aggiunta in precedenza.

  9. Fare clic sulla casella Criteri/Argomenti e digitare una virgola, seguita da 5, dopo il nome del campo.

    Il testo nella casella Criteri/Argomenti dovrebbe ora visualizzare quanto segue:

    [Forecasting].[Amount],5

  10. Nella colonna Alias digitare PredictAmount.

  11. Fare clic sulla riga vuota successiva nella colonna Origine e quindi selezionare di nuovo Funzione di stima .

  12. Nella colonna Campo selezionare PredictTimeSeries.

  13. Nel riquadro Modello di data mining selezionare la colonna Quantity e trascinarla nella casella Criteri/Argomenti per la seconda funzione PredictTimeSeries .

  14. Fare clic sulla casella Criteri/Argomenti e digitare una virgola, seguita da 5, dopo il nome del campo.

    Il testo nella casella Criteri/Argomenti dovrebbe ora visualizzare quanto segue:

    [Forecasting].[ Quantity],5

  15. Nella colonna Alias digitare PredictQuantity.

  16. Fare clic su Passa alla visualizzazione dei risultati della query.

    I risultati della query verranno visualizzati in formato tabulare.

Tenere presente che sono stati creati tre tipi diversi di risultati nel generatore di query, uno che utilizza i valori di una colonna e due che ottengono i valori stimati da una funzione di stima. I risultati della query contengono pertanto tre colonne distinte. La prima colonna contiene l'elenco di combinazioni di prodotto e area, mentre la seconda e la terza contengono ciascuna una tabella nidificata dei risultati della stima. Ogni tabella nidificata contiene intervalli temporali e valori stimati, come nella tabella di esempio seguente:

Risultati di esempio (le quantità sono troncate a due posizioni decimali):

M200 Europe PredictAmount

$TIME Amount
7/25/2008 99978.00
8/25/2008 145575.07
9/25/2008 116835.19
10/25/2008 116537.38
11/25/2008 107760.55

M200 Europe PredictQuantity

$TIME Quantità
7/25/2008 52
8/25/2008 67
9/25/2008 58
10/25/2008 57
11/25/2008 54

America del Nord M200 - PredictAmount

$TIME Amount
7/25/2008 348533.93
8/25/2008 340097.98
9/25/2008 257986.19
10/25/2008 374658.24
11/25/2008 379241.44

M200 America del Nord - PredictQuantity

$TIME Quantità
7/25/2008 272
8/25/2008 152
9/25/2008 250
10/25/2008 181
11/25/2008 290

Avviso

Le date utilizzate nel database di esempio sono state modificate per questa versione. Se si utilizza una versione precedente dei dati di esempio, è possibile che vengano visualizzati risultati diversi.

Salvataggio dei risultati della stima

Le opzioni per l'utilizzo dei risultati della stima sono molte. È possibile rendere i risultati bidimensionali, copiare i dati dalla vista dei risultati e incollarli in un foglio di lavoro di Excel o in un altro file.

Per semplificare il processo di salvataggio dei risultati, in Data Mining Designer è inoltre possibile salvare i dati in una vista origine dati. La funzionalità per salvare i risultati in una visualizzazione origine dati è disponibile solo in SQL Server Data Tools (SSDT). I risultati possono essere archiviati solo in un formato bidimensionale.

Per convertire i dati in formato flat nel riquadro Risultati

  1. Nel Generatore query di stima fare clic su Passa alla visualizzazione progettazione query.

    La visualizzazione cambierà per consentire la modifica manuale del testo della query DMX.

  2. Digitare la parola chiave FLATTENED dopo la parola chiave SELECT. Il testo completo della query dovrebbe risultare analogo al seguente:

    SELECT FLATTENED  
      [Forecasting].[Model Region],  
      (PredictTimeSeries([Forecasting].[Amount],5)) as [PredictAmount],  
      (PredictTimeSeries([Forecasting].[Quantity],5)) as [PredictQuantity]  
    FROM  
      [Forecasting]  
    
  3. Facoltativamente, è possibile digitare una clausola per limitare i risultati, simile all'esempio seguente:

    SELECT FLATTENED  
      [Forecasting].[Model Region],  
      (PredictTimeSeries([Forecasting].[Amount],5)) as [PredictAmount],  
      (PredictTimeSeries([Forecasting].[Quantity],5)) as [PredictQuantity]  
    FROM  
      [Forecasting]  
    WHERE [Forecasting].[Model Region] = 'M200 North America'   
    OR [Forecasting].[Model Region] = 'M200 Europe'  
    
    
  4. Fare clic su Passa alla visualizzazione dei risultati della query.

Per esportare i risultati della query di stima

  1. Fare clic su Salva risultati della query.

  2. Nella finestra di dialogo Salva risultato query data mining selezionare AdventureWorksDW2012. Se si desidera salvare i dati in un database relazionale diverso, è inoltre possibile creare una nuova origine dati.

  3. Nella colonna Nome tabella digitare un nuovo nome di tabella temporaneo, ad esempio Stime di test.

  4. Fare clic su Salva.

    Nota

    Per visualizzare la tabella creata, creare una connessione al motore di database dell'istanza in cui sono stati salvati i dati, quindi creare una query.

Conclusione

Si è appreso come compilare un modello Time Series di base, interpretare le previsioni e creare stime.

Le attività restanti in questa esercitazione sono facoltative e descrivono stime avanzate basate su serie temporali. Se si decide di procedere, verrà illustrata la procedura per aggiungere nuovi dati al modello e creare stime nella serie estesa. Verrà inoltre illustrata la procedura per eseguire una stima incrociata, tramite la tendenza nel modello ma sostituendo i dati con una nuova serie di dati.

Lezione successiva

Stime avanzate basate su serie temporali (Esercitazione intermedia sul data mining)

Vedere anche

Time Series Model Query Examples