Creazione di stime basate su serie temporali (Esercitazione intermedia sul data mining)
Nelle attività precedenti di questa lezione è stato creato un modello Time Series e sono stati esplorati i risultati. Per impostazione predefinita, Analysis Services crea sempre un set di cinque (5) stime per un modello time series e visualizza i valori stimati come parte del grafico di previsione. È tuttavia possibile creare previsioni compilando query di stima DMX (Data Mining Extensions).
In questa attività verrà creata una query di stima che genera le stesse stime esaminate in precedenza nel visualizzatore. Questa attività presuppone che siano già state completate le lezioni dell'Esercitazione di base sul data mining e che si abbia familiarità con l'utilizzo del generatore delle query di stima. Verrà ora illustrato come creare query specifiche per i modelli Time Series.
Creazione di stime basate su serie temporali
In genere il primo passaggio per creare una query di stima consiste nel selezionare un modello di data mining e una tabella di input. Tuttavia, un modello Time Series non richiede input aggiuntivi per una stima normale. Non è pertanto necessario specificare una nuova origine dati durante l'esecuzione di stime, a meno che non si aggiungano o sostituiscano dati nel modello.
Ai fini di questa lezione è necessario specificare il numero di intervalli per la stima. È inoltre possibile specificare il nome della serie per ottenere una stima per una determinata combinazione di prodotto e area.
Per selezionare un modello e una tabella di input
Nella scheda Stima modello di data mining della Designer di data mining fare clic su Seleziona modello nella casella Modello di data mining.
Nella finestra di dialogo Seleziona modello di data mining espandere la struttura Previsione, selezionare il modello di previsione dall'elenco e quindi fare clic su OK.
Ignorare la casella Seleziona tabelle di input .
Nota
Per i modelli Time Series non è necessario specificare un input distinto, a meno che non si stia eseguendo una stima incrociata.
Nella colonna Origine , nella griglia della scheda Stima modello di data mining fare clic sulla cella nella prima riga vuota e quindi selezionare Previsione modello di data mining.
Nella colonna Campo selezionare Area modello.
L'identificatore della serie verrà aggiunto alla query di stima per indicare a quale combinazione di modello e area si applica la stima.
Fare clic sulla riga vuota successiva nella colonna Origine e quindi selezionare Funzione di stima.
Nella colonna Campo selezionare PredictTimeSeries.
Nota
Con i modelli Time Series è inoltre possibile utilizzare la funzione
Predict
. Per impostazione predefinita, tuttavia, la funzione Predict crea una sola stima per ogni serie. Pertanto, per specificare più passaggi di stima, è necessario usare la funzione PredictTimeSeries .Nel riquadro Modello di data mining selezionare la colonna modello di data mining Amount. Trascinare Amount nella casella Criteri/Argomenti per la funzione PredictTimeSeries aggiunta in precedenza.
Fare clic sulla casella Criteri/Argomenti e digitare una virgola, seguita da 5, dopo il nome del campo.
Il testo nella casella Criteri/Argomenti dovrebbe ora visualizzare quanto segue:
[Forecasting].[Amount],5
Nella colonna Alias digitare
PredictAmount
.Fare clic sulla riga vuota successiva nella colonna Origine e quindi selezionare di nuovo Funzione di stima .
Nella colonna Campo selezionare PredictTimeSeries.
Nel riquadro Modello di data mining selezionare la colonna Quantity e trascinarla nella casella Criteri/Argomenti per la seconda funzione PredictTimeSeries .
Fare clic sulla casella Criteri/Argomenti e digitare una virgola, seguita da 5, dopo il nome del campo.
Il testo nella casella Criteri/Argomenti dovrebbe ora visualizzare quanto segue:
[Forecasting].[ Quantity],5
Nella colonna Alias digitare
PredictQuantity
.Fare clic su Passa alla visualizzazione dei risultati della query.
I risultati della query verranno visualizzati in formato tabulare.
Tenere presente che sono stati creati tre tipi diversi di risultati nel generatore di query, uno che utilizza i valori di una colonna e due che ottengono i valori stimati da una funzione di stima. I risultati della query contengono pertanto tre colonne distinte. La prima colonna contiene l'elenco di combinazioni di prodotto e area, mentre la seconda e la terza contengono ciascuna una tabella nidificata dei risultati della stima. Ogni tabella nidificata contiene intervalli temporali e valori stimati, come nella tabella di esempio seguente:
Risultati di esempio (le quantità sono troncate a due posizioni decimali):
M200 Europe PredictAmount
$TIME | Amount |
---|---|
7/25/2008 | 99978.00 |
8/25/2008 | 145575.07 |
9/25/2008 | 116835.19 |
10/25/2008 | 116537.38 |
11/25/2008 | 107760.55 |
M200 Europe PredictQuantity
$TIME | Quantità |
---|---|
7/25/2008 | 52 |
8/25/2008 | 67 |
9/25/2008 | 58 |
10/25/2008 | 57 |
11/25/2008 | 54 |
America del Nord M200 - PredictAmount
$TIME | Amount |
---|---|
7/25/2008 | 348533.93 |
8/25/2008 | 340097.98 |
9/25/2008 | 257986.19 |
10/25/2008 | 374658.24 |
11/25/2008 | 379241.44 |
M200 America del Nord - PredictQuantity
$TIME | Quantità |
---|---|
7/25/2008 | 272 |
8/25/2008 | 152 |
9/25/2008 | 250 |
10/25/2008 | 181 |
11/25/2008 | 290 |
Avviso
Le date utilizzate nel database di esempio sono state modificate per questa versione. Se si utilizza una versione precedente dei dati di esempio, è possibile che vengano visualizzati risultati diversi.
Salvataggio dei risultati della stima
Le opzioni per l'utilizzo dei risultati della stima sono molte. È possibile rendere i risultati bidimensionali, copiare i dati dalla vista dei risultati e incollarli in un foglio di lavoro di Excel o in un altro file.
Per semplificare il processo di salvataggio dei risultati, in Data Mining Designer è inoltre possibile salvare i dati in una vista origine dati. La funzionalità per salvare i risultati in una visualizzazione origine dati è disponibile solo in SQL Server Data Tools (SSDT). I risultati possono essere archiviati solo in un formato bidimensionale.
Per convertire i dati in formato flat nel riquadro Risultati
Nel Generatore query di stima fare clic su Passa alla visualizzazione progettazione query.
La visualizzazione cambierà per consentire la modifica manuale del testo della query DMX.
Digitare la parola chiave
FLATTENED
dopo la parola chiaveSELECT
. Il testo completo della query dovrebbe risultare analogo al seguente:SELECT FLATTENED [Forecasting].[Model Region], (PredictTimeSeries([Forecasting].[Amount],5)) as [PredictAmount], (PredictTimeSeries([Forecasting].[Quantity],5)) as [PredictQuantity] FROM [Forecasting]
Facoltativamente, è possibile digitare una clausola per limitare i risultati, simile all'esempio seguente:
SELECT FLATTENED [Forecasting].[Model Region], (PredictTimeSeries([Forecasting].[Amount],5)) as [PredictAmount], (PredictTimeSeries([Forecasting].[Quantity],5)) as [PredictQuantity] FROM [Forecasting] WHERE [Forecasting].[Model Region] = 'M200 North America' OR [Forecasting].[Model Region] = 'M200 Europe'
Fare clic su Passa alla visualizzazione dei risultati della query.
Per esportare i risultati della query di stima
Fare clic su Salva risultati della query.
Nella finestra di dialogo Salva risultato query data mining selezionare AdventureWorksDW2012. Se si desidera salvare i dati in un database relazionale diverso, è inoltre possibile creare una nuova origine dati.
Nella colonna Nome tabella digitare un nuovo nome di tabella temporaneo, ad esempio Stime di test.
Fare clic su Salva.
Nota
Per visualizzare la tabella creata, creare una connessione al motore di database dell'istanza in cui sono stati salvati i dati, quindi creare una query.
Conclusione
Si è appreso come compilare un modello Time Series di base, interpretare le previsioni e creare stime.
Le attività restanti in questa esercitazione sono facoltative e descrivono stime avanzate basate su serie temporali. Se si decide di procedere, verrà illustrata la procedura per aggiungere nuovi dati al modello e creare stime nella serie estesa. Verrà inoltre illustrata la procedura per eseguire una stima incrociata, tramite la tendenza nel modello ma sostituendo i dati con una nuova serie di dati.
Lezione successiva
Stime avanzate basate su serie temporali (Esercitazione intermedia sul data mining)