Anpassen und Verarbeiten des Forecasting-Modells (Data Mining-Lernprogramm für Fortgeschrittene)
Der Microsoft Time Series-Algorithmus umfasst mehrere Parameter, die sich darauf auswirken, wie ein Modell angelegt und wie die Zeitdaten analysiert werden. Sie können diese Eigenschaften ändern, um Vorhersagen mithilfe des Miningmodells zu steuern.
Für diese Aufgabe im Lernprogramm nehmen Sie folgende Änderung an den Parametern vor:
- Sie passen den Wert des PERIODICITY_HINT-Parameters für das Modell Forecasting an. Dieser Parameter enthält die Algorithmusinformationen dazu, mit welcher Häufigkeit das Muster in den Daten wiederholt wird. Für die Daten in AdventureWorks DW2008 wurde ein Muster auf monatlicher Basis festgelegt, und es gilt eine jährliche Periodizität. Sie legen den PERIODICITY_HINT-Parameter daher auf 12 fest, um anzugeben, dass ein Muster nach jeweils 12 Werten wiederholt wird.
Außerdem überprüfen Sie die Einstellungen zweier zentraler Parameter, die in SQL Server 2008 im Rahmen der Verbesserungen des Microsoft Time Series-Algorithmus eingeführt wurden.
Mit dem FORECAST_METHOD-Parameter wird die Optimierung des Zeitreihenalgorithmus für kurz- oder langfristige Vorhersagen gesteuert. Der FORECAST_METHOD-Parameter ist standardmäßig auf MIXED festgelegt. Dies bedeutet, dass zwei verschiedene Vorhersagealgorithmen zusammengeführt werden, um einen Mittelweg aus Kurzzeit- und Langzeitvorhersage auszuführen.
Mit dem PREDICTION_SMOOTHING-Parameter wird die Mischung aus kurz- und langfristigen Vorhersagen gesteuert. Der Parameter ist standardmäßig auf 0,5 festgelegt; dies stellt den besten Kompromiss für die Gesamtgenauigkeit dar.
Nachdem die Änderungen vorgenommen wurden, wird das Modell verarbeitet.
So ändern Sie die Algorithmusparameter
Klicken Sie auf der Registerkarte Miningmodelle mit der rechten Maustaste auf Forecasting, und wählen Sie Algorithmusparameter festlegen.
Klicken Sie im Dialogfeld Algorithmusparameter in der Zeile PERIODICITY_HINT auf die Spalte Value, geben Sie {12} (mit den Klammern) ein.
Überprüfen Sie, ob das Textfeld Value in der Zeile FORECAST_METHOD entweder leer ist oder den Wert MIXED enthält. Wenn ein anderer Wert eingegeben wurde, geben Sie MIXED ein, um den Parameter wieder auf den Standardwert einzustellen.
Überprüfen Sie in der Zeile PREDICTION_SMOOTHING, dass das Textfeld Value leer ist oder den Wert 0,5 aufweist. Wenn ein anderer Wert eingegeben wurde, klicken Sie auf Value und geben 0,5 ein, um den Parameter wieder auf den Standardwert einzustellen.
Hinweis Der PREDICTION_SMOOTHING-Parameter ist nur in SQL Server Enterprise verfügbar. Sie können den Wert des PREDICTION_SMOOTHING-Parameters daher in SQL Server Standard nicht ändern. Das Standardverhalten ist jedoch gleich.
Klicken Sie auf OK.
So verarbeiten Sie das Forecasting-Modell
Klicken Sie im Menü Miningmodell von BI Development Studio auf Miningstruktur und alle Modelle verarbeiten.
Klicken Sie in der Meldung mit der Frage, ob Sie das Projekt erstellen und bereitstellen möchten, auf Ja.
Klicken Sie im Dialogfeld Miningstruktur verarbeiten - Forecasting auf Ausführen.
Das Dialogfeld Verarbeitungsstatus wird geöffnet und zeigt Informationen zur Verarbeitung des Modells an. Die Verarbeitung des Modells kann einige Zeit in Anspruch nehmen.
Nachdem die Verarbeitung abgeschlossen ist, klicken Sie auf Schließen, um das Dialogfeld Verarbeitungsstatus zu schließen.
Klicken Sie auf Schließen, um das Dialogfeld Miningstruktur verarbeiten - Forecasting wieder zu schließen.
Behandeln von unvollständigen Daten (optional)
Es kann häufig vorkommen, dass Verkaufsdaten unvollständig und mit NULL-Werten angegeben sind; auch kann es sein, dass die entsprechenden Daten nicht rechtzeitig von der Niederlassung gemeldet wurden und das Ende der Reihe eine leere Zelle aufweist. In diesen Szenarien wird der folgende Fehler von Analysis Services generiert, und das Modell wird nicht verarbeitet.
"Fehler (Data Mining): Nicht synchronisierte Timestamps, die mit den <Reihenname>-Reihen des <Modellname>-Miningmodells beginnen. Alle Zeitreihen müssen an der gleichen Zeitmarkierung enden und dürfen keine beliebig fehlenden Datenpunkte aufweisen. Wenn Sie den MISSING_VALUE_SUBSTITUTION-Parameter auf Previous oder auf eine numerische Konstante festlegen, werden nach Möglichkeit automatisch fehlende Datenpunkte ergänzt."
Sie können diese Fehlermeldung umgehen, indem Sie angeben, dass fehlende Werte von Analysis Services automatisch mit den folgenden Methoden bereitgestellt werden:
Verwendung eines Mittelwerts. Dieser wird mit allen gültigen Werten in der gleichen Datenreihe berechnet.
Verwendung des vorherigen Werts. Sie können mehrere fehlende Zellen durch vorherige Werte ersetzen; Sie können jedoch keine Anfangswerte auffüllen.
Verwendung eines konstanten Werts, der vom Benutzer angegeben wird.
So füllen Sie Lücken mit Durchschnittswerten
Klicken Sie auf der Registerkarte Miningmodelle mit der rechten Maustaste auf die Spalte Forecasting, und wählen Sie Algorithmusparameter festlegen.
Klicken Sie im Dialogfeld Algorithmusparameter in der Zeile MISSING_VALUE_SUBSTITUTION auf die Spalte Wert, und geben Sie Mittelwert ein.
Nächste Aufgabe in der Lektion
Prüfen des Forecasting-Modells (Data Mining-Lernprogramm für Fortgeschrittene)