Hinzufügen eines aggregierten Forecasting-Modells (Data Mining-Lernprogramm für Fortgeschrittene)
Aus der Untersuchung des Forecasting-Modells haben Sie erkannt, dass die Verkäufe in den meisten Regionen einem bestimmten Muster folgen. Einige Regionen und Modelle wie das Modell M200 im Pazifischen Raum weisen jedoch deutlich abweichende Trends auf. Unterschiede zwischen einzelnen Regionen treten häufig auf und können durch zahlreiche Faktoren verursacht werden, einschließlich Marketingaktionen, fehlerhafter Berichterstellung sowie politischer Faktoren.
Sie können die Auswirkungen dieser Faktoren auf Projektionen minimieren, indem Sie ein allgemeines Miningmodell erstellen, das auf den aggregierten Zahlen aller Verkäufe weltweit basiert. Anschließend können Sie Vorhersagen mit diesem Modell treffen und auf einzelne Regionen anwenden. Abschließend vergleichen Sie die Vorhersagen für die verschiedenen Produkte.
Erstellen der Daten für das allgemeine Modell
Der erste Schritt zum Erstellen des allgemeinen Modells besteht im Aggregieren der weltweiten Verkaufszahlen. Zu diesem Zweck können Sie eine spezielle Datenquellensicht erstellen, die eine vorhandene Datenquelle verwendet, jedoch Berechnungen wie Summen oder Durchschnittswerte ausführt.
So erstellen Sie eine Datenquellensicht mithilfe einer benutzerdefinierten Abfrage oder Berechnung
Klicken Sie im Projektmappen-Explorer mit der rechten Maustaste auf Datenquellensichten, und wählen Sie Neue Datenquellensicht aus.
Klicken Sie auf der Seite Willkommen des Assistenten auf Weiter.
Wählen Sie auf der Seite Datenquelle auswählen die Datenquelle Adventure Works DW2008 aus, klicken Sie auf Weiter.
Klicken Sie auf der Seite Tabellen und Sichten auswählen auf Weiter.
Geben Sie auf der Seite Assistenten abschließen den Namen AllRegions ein, und klicken Sie auf Fertig stellen.
Klicken Sie danach mit der rechten Maustaste auf die leere Entwurfsoberfläche der Datenquellensicht, und wählen Sie Neue benannte Abfrage aus.
Geben Sie im Dialogfeld Benannte Abfrage erstellen im Feld Name den Namen AllRegions ein, und geben Sie im Feld Beschreibung die Beschreibung Summen- und Durchschnittswerte der Verkäufe für alle Modelle und Regionen ein.
Geben Sie die folgende Anweisung im SQL-Textbereich ein:
SELECT ReportingDate, SUM([Quantity]) as SumQty, AVG([Quantity]) as AvgQty, SUM([Amount]) AS SumAmt, AVG([Amount]) AS AvgAmt, 'All Regions' as [Region] FROM dbo.vTimeSeries GROUP BY ReportingDate
Klicken Sie auf OK.
Klicken Sie mit der rechten Maustaste auf die Tabelle AllRegions, und wählen Sie Daten durchsuchen aus.
Die neue Datenquellensicht enthält einen Summen- und einen Durchschnittswert für alle verkauften Produkte weltweit. Die Verkäufe können auch nach Modell gruppiert und aggregiert werden. In dieser Lektion erstellen Sie jedoch ein Zeitreihenmodell für Vorhersagen mit einer beliebigen Kombination aus Region und Produkt.
Nachdem Sie die neue Datensicht erstellt haben, müssen Sie eine neue Miningstruktur und ein Miningmodell auf Basis dieser Struktur erstellen. Inzwischen sollten Sie mit dem Erstellen einer Miningstruktur vertraut sein. Die nachfolgenden Anweisungen wurden daher vereinfacht.
So erstellen Sie eine Miningstruktur und ein Miningmodell mit aggregierten Daten
Klicken Sie im Projektmappen-Explorer mit der rechten Maustaste auf Miningstrukturen, und wählen Sie Neue Miningstruktur, um den Data Mining-Assistenten zu starten.
Wählen Sie im Data Mining-Assistenten folgende Optionen aus:
Algorithmus: Microsoft Time Series
Datenquellensicht: AllRegions
Schlüssel: ReportingDate (Key Time) und Region (Key)
Input und Predict: AvgAmt, AvgQty, SumAmt und SumQty
Miningstrukturname: Alle Regionen
Miningmodellname: Alle Regionen
Verarbeiten Sie die Struktur und das Modell.
Anzeigen der Ergebnisse
Bevor Sie eine Entscheidung über das allgemeine Modell für weltweite Projektionen treffen, sollten Sie ausreichend mit Projektionen vertraut sein. Eine Betrachtung der Miningmodelle und Vorhersagen für die verschiedenen aggregierten Reihen im Microsoft Time Series-Viewer wirft verschiedene Fragen auf:
Bis Juni 2002 folgen alle Trendlinien nahezu dem gleichen Muster. Ab diesem Zeitpunkt weisen die Linien für Menge und Summe unterschiedliche Verläufe auf. Was hat die Änderung verursacht?
Im Juli 2004 laufen die Linien erneut auseinander. Worin besteht die Ursache?
Bedenken Sie, dass die Vorhersagen für die Reihe M200 North America deutlich höher ausgefallen sind als für die anderen Produkte und Regionen. Sie befürchten, die Projektionen könnten fehlerhaft sein und eine Einbeziehung dieser Reihe könnte das allgemeine Modell verfälschen, das Sie erstellt haben.
In der nächsten Aufgabe vergleichen Sie die Trendlinien und Vorhersagen für die einzelnen Reihenmodelle mit den Modellen auf Basis von aggregierten Daten, um zu sehen, wie sich die zugrunde liegenden Daten auf das Modell auswirken.
Wenn Sie sicher sind, dass das Modell richtig ist und Sie ein ausreichendes Verständnis der Ergebnisse besitzen, können Sie mit der Aufgabe Treffen von Vorhersagen mit dem gemittelten Forecasting-Modell (Data Mining-Lernprogramm für Fortgeschrittene) fortfahren.
Nächste Aufgabe in der Lektion
Grundlegendes zu Trends im Zeitreihenmodell (Data Mining-Lernprogramm für Fortgeschrittene)