Grundlegendes zu Trends im Zeitreihenmodell (Data Mining-Lernprogramm für Fortgeschrittene)
Wenn Sie verschiedene Modelle betrachten, die auf aggregierten Daten basieren, können Sie erkennen, dass die Trend- und Prognoselinien sich sehr stark unterscheiden, je nachdem, ob Sie Summen- und Mengenwerte aus den einzelnen Modellen summiert oder einen Mittelwert gebildet haben.
Bevor Sie eine Entscheidung über das allgemeine Modell für weltweite Projektionen treffen, überprüfen Sie die zugrunde liegenden Daten mit einem Vorhersagediagramm, um die Projektionen besser zu verstehen.
Bis Juni 2002 ist eine Überlappung der Trendlinien zu verzeichnen; im Anschluss weisen die Linien für Menge und Summe unterschiedliche Verläufe auf. Im Juli 2004 sind erneut divergierende Linienverläufe zu verzeichnen.
In dieser Aufgabe erstellen Sie eine benannte Berechnung auf Basis der ursprünglichen Datenquellensicht zur Unterstützung für die Nachverfolgung der Beziehung zwischen Menge und Preis. Anschließend erstellen Sie ein PivotChart für dieses Verhältnis, um die Teilungen der Trendlinien zu analysieren.
Überprüfen der zugrunde liegenden Daten
So erstellen Sie eine benannte Berechnung
Erweitern Sie die Datenquellensichten im Projektmappen-Explorer, und doppelklicken Sie auf SalesByRegion.dsv.
Klicken Sie mit der rechten Maustaste auf die vTimeSeries-Tabelle, und wählen Sie Neue benannte Berechnung aus.
Geben Sie in das Feld Benannte Berechnung erstellen für Name den Namen UnitAmt ein.
Geben Sie in das Textfeld Ausdruck den Ausdruck Amount/Quantity ein. Klicken Sie auf OK.
Die vTimeSeries-Tabelle enthält jetzt die zusätzliche berechnete Spalte UnitAmt. Die berechnete Spalte wird nur in der Datenquellensichtdefinition für das Data Mining-Projekt gespeichert und wirkt sich nicht auf die zugrunde liegende relationale Datenbanksicht aus.
So erstellen Sie ein PivotChart mithilfe der benannten Berechnung
Klicken Sie mit der rechten Maustaste auf die vTimeSeries-Tabelle, und wählen Sie Daten durchsuchen aus.
Klicken Sie auf der Registerkarte Tabelle "vTimeSeries" durchsuchen auf die Registerkarte Pivot Table.
Ziehen Sie das Feld TimeIndex aus dem Feld PivotTable-Feldliste auf die PivotTable-Entwurfsoberfläche in den Bereich Spaltenfelder hierher ziehen.
Ziehen Sie das Feld ModelRegion aus dem Feld PivotTable-Feldliste auf die PivotTable-Entwurfsoberfläche in den Bereich Zeilenfelder hierher ziehen.
Ziehen Sie das Feld UnitAmt aus dem Feld PivotTable-Feldliste auf die PivotTable-Entwurfsoberfläche in den Bereich Gesamtsummen oder Detailfelder hierher ziehen.
Überprüfen der aggregierten Modelle
Aus der PivotTable können Sie erkennen, dass – möglicherweise aufgrund von Preisänderungen – zu mehreren Zeitpunkten substanzielle Änderungen im Hinblick auf die Verkaufsmenge pro Einheit zu verzeichnen sind. Eine weitere signifikante Änderung ist im Juli 2003 festzustellen, als das neue Modell T1000 in allen Regionen eingeführt wurde. All diese Änderungen wirken sich auf die Trends aus, die im Modell berechnet werden. Ein verallgemeinertes Modell ist nützlich, da es die Auswirkungen von einzelnen Änderungen minimiert. In einigen Szenarios können Sie bei Bedarf jedoch auch separate Modelle für neue Niederlassungen erstellen, um zu verhindern, dass sich diese Daten auf die Trends auswirken.
Für dieses Lernprogramm wählen Sie eines der aggregierten Modelle aus, das auf die Verkaufsprojektionen angewendet werden soll. Bedenken Sie, dass Sie vier verschiedene Miningmodelle erstellt haben, die jeweils auf anderen aggregierten Measures basieren. Sie verwenden die Tools, die im Zeitreihen-Viewer bereitgestellt werden, zusammen mit der PivotTable, die Sie bereits zur Unterstützung dieser Entscheidung erstellt haben. Das folgende Diagramm zeigt das Zeitreihendiagramm, das für die aggregierten Modelle erstellt wurde. Die zwei grauen Reihenlinien zeigen Durchschnittswerte an, und die zwei grünen Reihenlinien zeigen Summenwerte an.
Bevor Sie sich entscheiden, welches Miningmodell für die Verkaufsprojektionen verwendet werden soll, möchten Sie noch folgende Punkte untersuchen:
Miningmodelle, die auf der Summe basieren, weisen einen Aufwärtstrend auf, während Modelle, die auf der Menge basieren, einen zyklischen Rückgang aufweisen.
Die Projektionen, die auf dem durchschnittlichen Betrag basieren (AvgAmt) und die Projektionen, die auf der summierten Menge basieren (SumQty), weisen deutliche Unterschiede auf.
Die Trendlinien in drei Modellen pendeln sich nach 5 Vorhersagen ein; die Trendlinie im Modell auf Basis der summierten Menge weist jedoch weiterhin einen steilen Anstieg auf.
Wenn Sie weitere Informationen benötigen, können Sie drei Punkte überprüfen. Aktivieren Sie zunächst das Kontrollkästchen Abweichungen anzeigen, um die Standardabweichungen für jede Vorhersage anzuzeigen. Ein längerer Abweichungsbalken weist auf größere Varianzen für den vorhergesagten Wert hin.
Beachten Sie weiterhin, dass als Einheit für die y-Achse Prozentwerte verwendet werden, und achten Sie darauf, dass sich die Skalierung des Diagramms in Abhängigkeit von den Daten im Diagramm ändert. Die Einheiten auf der Prozentsatzachse werden vom Microsoft Time Series-Viewer zur Optimierung der Darstellung automatisch angepasst. Wenn Sie eine spezifische oder eine feste Skala verwenden möchten, sollten Sie die Werte daher mit einer Vorhersageabfrage erstellen und exportieren und ein Diagramm in einer anderen Anwendung wie Microsoft Excel erstellen.
Als Drittes können Sie Teilungen im Modell mithilfe der Entscheidungsstruktursicht des Zeitreihenmodells untersuchen. Eine Teilung oder Verzweigung in der Entscheidungsstruktur in einem Zeitreihenmodell kann darauf hinweisen, dass sich die Steigung der Trendlinie an einem bestimmten Punkt signifikant geändert hat oder dass sich die Struktur aus einem anderen Grund verzweigt hat. In der Sicht, in der die Teilungen als Knoten in einer Strukturansicht angezeigt werden, können Sie einen Drilldown zu den Ursachen der Teilung durchführen.
So zeigen Sie die Entscheidungsstruktur für jede Reihe an
Erweitern Sie die Datenquellensichten im Projektmappen-Explorer, und klicken Sie mit der rechten Maustaste auf AllRegions.dsv.
Klicken Sie mit der rechten Maustaste auf die vTimeSeries-Tabelle, und wählen Sie Daten durchsuchen aus.
Klicken Sie auf der Registerkarte Tabelle "vTimeSeries" durchsuchen auf die Registerkarte Pivot Table.
Ziehen Sie das ReportingDate-Feld aus dem Feld PivotTable-Feldliste auf die PivotTable-Entwurfsoberfläche in den Bereich Spaltenfelder hierher ziehen.
Ziehen Sie das Feld Region aus dem Feld PivotTable-Feldliste auf die PivotTable-Entwurfsoberfläche in den Bereich Zeilenfelder hierher ziehen.
Ziehen Sie das Feld UnitAmt aus dem Feld PivotTable-Feldliste auf die PivotTable-Entwurfsoberfläche in den Bereich Gesamtsummen oder Detailfelder hierher ziehen.
Dabei darf nicht außer Acht gelassen werden, dass sich Datenwerte am Ende der Datenreihe stärker auf Vorhersagen auswirken können als Datenwerte am Anfang der Datenreihe, da ein Zeitreihenmodell mit gleitenden Durchschnitten berechnet wird. Außerdem wirkt sich der Periodizitätshinweis, den Sie beim Erstellen des Modells angegeben haben, auf die Verwendung der Durchschnittswerte im Zeitverlauf aus.
Schlussfolgerung
Auf Grundlage dieser Analyse haben Sie Folgendes gelernt:
Die Menge stellt grundsätzlich eine unbeständige Größe dar, da die absoluten Werte für einige Niederlassungen sehr gering sein können. Ferner werden die Unterschiede in einer Diagrammansicht eher verstärkt, da die Werte als Prozentsatz dargestellt werden.
Die Summe scheint eine noch schwankungsabhängigere Größe zu sein, da sie einerseits von der Menge abhängt und andererseits auch Preisänderungen unterliegt.
Der starke Aufwärtstrend in den Vorhersagen für M200 North America wird durch ein sehr hohes Verkaufsvolumen für diese Kombination aus Produkt und Region gegen Ende der Vergangenheitsdaten verursacht.
Nach der ausführlichen Untersuchung der Daten sowie der verschiedenen Modelle haben Sie nun ein zuverlässiges Modell gefunden. In den Statistiken für die InfoTipps oder durch Durchsuchen oder Abfragen des Modellinhalts können Sie Formeln sowie unterstützende Daten zur Begründung der Analyse für Ihre Geschäftsbenutzer abrufen.
In der nächsten Lektion erstellen Sie anhand des Modells, das auf der durchschnittlichen Menge basiert, Vorhersagen für die Menge in allen Regionen.
Nächste Aufgabe in der Lektion