Condividi tramite


Personalizzazione ed elaborazione del modello di previsione (Esercitazione intermedia sul data mining)

L'algoritmo Microsoft Time Series fornisce parametri che influiscono sulla modalità di creazione di un modello e sulla modalità di analisi dei dati temporali. La modifica di queste proprietà può influire in modo significativo sul modo in cui il modello di data mining esegue le stime.

In questa attività dell'esercitazione si modificherà il modello nel modo seguente:

  1. È possibile personalizzare il modo in cui il modello gestisce i periodi di tempo aggiungendo un nuovo valore per il parametro PERIODICITY_HINT .

  2. Si conosceranno altri due importanti parametri per l'algoritmo Microsoft Time Series: FORECAST_METHOD che consente di controllare il metodo utilizzato per la previsione e PREDICTION_SMOOTHING che consente di personalizzare la combinazione di stime a lungo e breve termine.

  3. Facoltativamente, si indicherà in che modo si desidera che l'algoritmo attribuisca i valori mancanti.

  4. Dopo avere apportato tutte le modifiche, si procederà alla distribuzione e all'elaborazione del modello.

Impostazione dei parametri di Time Series

Hint di periodicità

Il parametro PERIODICITY_HINT fornisce all'algoritmo informazioni sui periodi di tempo aggiuntivi che si prevede di visualizzare nei dati. Per impostazione predefinita, i modelli Time Series tenteranno di rilevare automaticamente un modello nei dati. Se tuttavia si conosce già il ciclo temporale previsto, l'indicazione di un hint di periodicità può migliorare potenzialmente l'accuratezza del modello. Se si fornisce tuttavia l'hint di periodicità errato, l'accuratezza può diminuire. Di conseguenza, in caso di dubbi sul valore da utilizzare, è preferibile utilizzare il valore predefinito.

Ad esempio, la vista usata per questo modello aggrega i dati sulle vendite di Adventure Works DW Multidimensional 2012 su base mensile. Ogni intervallo di tempo utilizzato dal modello rappresenta pertanto un mese e tutte le stime saranno anch'esse indicate in termini di mesi. Poiché sono presenti 12 mesi in un anno e si prevede che i modelli di vendita si ripetano più o meno su base annuale, si imposterà il parametro PERIODICITY_HINT su 12per indicare che 12 intervalli di tempo (mesi) costituiscono un ciclo di vendita completo.

Metodo di previsione

Il parametro FORECAST_METHOD controlla se l'algoritmo time series è ottimizzato per le stime a breve o a lungo termine. Per impostazione predefinita, il parametro FORECAST_METHOD è impostato su MIXED, il che significa che due algoritmi diversi vengono combinati ed equilibrati per fornire buoni risultati sia per la stima a breve termine che a lungo termine.

Se tuttavia si desidera utilizzare un algoritmo particolare, è possibile modificare il valore in ARIMA o ARTXP.

Ponderazione Long-Term e stime Short-Term

È inoltre possibile personalizzare la modalità di combinazione delle stime a lungo e a breve termine tramite il parametro PREDICTION_SMOOTHING. Per impostazione predefinita, questo parametro è impostato su 0,5, che generalmente fornisce il miglior bilanciamento per l'accuratezza complessiva.

Per modificare i parametri dell'algoritmo

  1. Nella scheda Modelli di data mining fare clic con il pulsante destro del mouse su Previsione e scegliere Imposta parametri algoritmo.

  2. PERIODICITY_HINT Nella riga della finestra di dialogo Parametri algoritmo fare clic sulla colonna Valore, quindi digitare {12}, incluse le parentesi graffe.

    Per impostazione predefinita, verrà aggiunto il valore {1}.

  3. FORECAST_METHOD Nella riga verificare che la casella di testo Valore sia vuota o impostata su MIXED. Se è stato immesso un valore diverso, digitare MIXED per tornare al valore predefinito.

  4. Nella riga PREDICTION_SMOOTHING verificare che la casella di testo Valore sia vuota o impostata su 0,5. Se è stato immesso un valore diverso, fare clic su Valore e digitare 0.5 per tornare al valore predefinito.

    Nota

    Il parametro PREDICTION_SMOOTHING è disponibile solo in SQL Server Enterprise. Pertanto, non è possibile visualizzare o modificare il valore del parametro PREDICTION_SMOOTHING in SQL Server Standard. Il comportamento predefinito consiste tuttavia nell'utilizzare entrambi gli algoritmi con un fattore di ponderazione equivalente.

  5. Fare clic su OK.

Gestione di dati mancanti (facoltativo)

In diversi casi, è possibile che nei dati di vendita siano presenti gap riempiti con valori Null oppure che un negozio non sia stato in grado di inviare il report prima della scadenza, lasciando una cella vuota alla fine della serie. In questi scenari, Analysis Services genera l'errore seguente e non elabora il modello.

"Errore (data mining): timestamp non sincronizzati a partire dal nome> della serie serie<, del modello di data mining, <del nome> del modello di data mining. Tutte le serie temporali devono terminare allo stesso contrassegno temporale e i punti dati non possono essere omessi arbitrariamente. Se si imposta il parametro MISSING_VALUE_SUBSTITUTION su Previous o su una costante numerica, i punti dati mancanti verranno aggiunti automaticamente ove possibile."

Per evitare questo errore, è possibile specificare che Analysis Services fornisce automaticamente nuovi valori per colmare le lacune usando uno dei metodi seguenti:

  • Utilizzo di un valore medio. La media viene calcolata utilizzando tutti i valori validi nella stessa serie di dati.

  • Utilizzo del valore precedente. È possibile sostituire i valori precedenti di più celle mancanti, ma non è possibile riempire i valori iniziali.

  • Utilizzo di un valore costante fornito dall'utente.

Per specificare che le lacune vengano colmate tramite valori medi

  1. Nella scheda Modelli di data mining fare clic con il pulsante destro del mouse sulla colonna Previsione e scegliere Imposta parametri algoritmo.

  2. Nella riga MISSING_VALUE_SUBSTITUTION della finestra di dialogo Parametri algoritmo fare clic sulla colonna Valore e digitare Mean.

Compilare il modello

Per utilizzare il modello, è necessario distribuirlo a un server ed elaborarlo mediante l'esecuzione di dati di training tramite l'algoritmo.

Per elaborare il modello di previsione

  1. Nel menu Modello di data mining di SQL Server Data Tools selezionare Elabora struttura di data mining e Tutti i modelli.

  2. All'avviso che chiede se si vuole compilare e distribuire il progetto, fare clic su .

  3. Nella finestra di dialogo Elaborazione struttura di data mining - Previsione fare clic su Esegui.

    Verrà visualizzata la finestra di dialogo Stato processo per visualizzare informazioni sull'elaborazione del modello. L'elaborazione del modello può richiedere alcuni minuti.

  4. Al termine dell'elaborazione, fare clic su Chiudi per uscire dalla finestra di dialogo Stato processo .

  5. Fare di nuovo clic su Chiudi per uscire dalla finestra di dialogo Struttura di data mining - Previsione .

Attività successiva della lezione

Esplorazione del modello di previsione (Esercitazione intermedia sul data mining)

Vedere anche

Riferimento tecnico per l'algoritmo Microsoft Time Series
Algoritmo Microsoft Time Series
Requisiti e considerazioni sull'elaborazione (data mining)