Freigeben über


Verzögerte Features für Zeitreihenvorhersagen in AutoML

In diesem Artikel wird beschrieben, wie automatisiertes maschinelles Lernen (AutoML) in Azure Machine Learning Features für Verzögerungs- und Rolling-Window-Aggregation erstellt, die Ihnen bei der Prognose von Regressionsmodellen der Zeitreihen helfen. Die AutoML-Features verwenden historische Modelldaten, welche die Modellgenauigkeit erheblich erhöhen können, indem sie dem Modell helfen, Korrelationsmuster rechtzeitig zu erlernen.

Wenn Sie mehr über die Prognosemethodik in AutoML erfahren möchten, lesen Sie Übersicht über Prognosemethoden in AutoML. Informationen zu Trainingsbeispielen für Prognosemodelle in AutoML finden Sie unter Einrichten von AutoML zum Trainieren eines Zeitreihenprognosemodells mit dem SDK und CLI.

Featurisierung der Verzögerung in AutoML

AutoML generiert Verzögerungsfeatures, die dem Prognosehorizont entsprechen. In diesem Abschnitt wird die Featurisierung der Verzögerung in AutoML für ein Modell mit einem Prognosehorizont von drei und einer Zielverzögerungsreihenfolge von eins untersucht. In den folgenden Tabellen werden die Modelldaten und Verzögerungsfeatures für eine monatliche Zeitreihe dargestellt.

Tabelle 1: Ursprüngliche Zeitreihe

Datum $y_t$
1.1.2001 0
1.2.2001 10
1.3.2001 20
1.4.2001 30
1.5.2001 40
1.6.2001 50

Im ersten Schritt generieren wir nur das Verzögerungsfeature für den Horizont $h=1$. Die nachfolgenden Tabellen veranschaulichen, warum der Prozess einzelne Horizonte verwendet, um die Featurisierung der Verzögerungen zu vervollständigen.

Tabelle 2: Featurisierung der Verzögerung für Horizont $h=1$

Datum $y_t$ Origin $y_{t-1}$ $h$
1.1.2001 0 1.12.2000 - 1
1.2.2001 10 1.1.2001 0 1
1.3.2001 20 1.2.2001 10 1
1.4.2001 30 1.3.2001 20 1
1.5.2001 40 1.4.2001 30 1
1.6.2001 50 1.5.2001 40 1

AutoML generiert die Daten in Tabelle 2 aus den Daten in Tabelle 1, indem die Spalte $y_t$ um eine einzelne Beobachtung nach unten verschoben wird. Die Tabellen 2 bis 5 enthalten die Spalte Ursprung, um die Datumsangaben anzuzeigen, aus denen die Verzögerungsfeatures stammen.

Im ersten Schritt wird nur das Verzögerungsfeature für den Prognosehorizont $h=2$ generiert.

Tabelle 3: Featurisierung der Verzögerung für Prognosehorizont $h=2$

Datum $y_t$ Origin $y_{t-2}$ $h$
1.1.2001 0 1.11.2000 - 2
1.2.2001 10 1.12.2000 - 2
1.3.2001 20 1.1.2001 0 2
1.4.2001 30 1.2.2001 10 2
1.5.2001 40 1.3.2001 20 2
1.6.2001 50 1.4.2001 30 2

AutoML generiert die Daten in Tabelle 3 aus den Daten in Tabelle 1, indem die Spalte $y_t$ um zwei Beobachtungen nach unten verschoben wird.

Im nächsten Schritt generieren wir nur das Verzögerungsfeature für den Prognosehorizont $h=3$.

Tabelle 4: Featurisierung der Verzögerung für Prognosehorizont $h=3$

Datum $y_t$ Origin $y_{t-3}$ $h$
1.1.2001 0 1.10.2000 - 3
1.2.2001 10 1.11.2000 - 3
1.3.2001 20 1.12.2000 - 3
1.4.2001 30 1.1.2001 0 3
1.5.2001 40 1.2.2001 10 3
1.6.2001 50 1.3.2001 20 3

Im letzten Schritt werden die Daten in den Tabellen 1, 2 und 3 verkettet und die Zeilen neu angeordnet.

Tabelle 5: Featurisierung der Verzögerung abgeschlossen

Datum $y_t$ Origin $y_{t-1}^{(h)}$ $h$
1.1.2001 0 1.12.2000 - 1
1.1.2001 0 1.11.2000 - 2
1.1.2001 0 1.10.2000 - 3
1.2.2001 10 1.1.2001 0 1
1.2.2001 10 1.12.2000 - 2
1.2.2001 10 1.11.2000 - 3
1.3.2001 20 1.2.2001 10 1
1.3.2001 20 1.1.2001 0 2
1.3.2001 20 1.12.2000 - 3
1.4.2001 30 1.3.2001 20 1
1.4.2001 30 1.2.2001 10 2
1.4.2001 30 1.1.2001 0 3
1.5.2001 40 1.4.2001 30 1
1.5.2001 40 1.3.2001 20 2
1.5.2001 40 1.2.2001 10 3
1.6.2001 50 1.4.2001 40 1
1.6.2001 50 1.4.2001 30 2
1.6.2001 50 1.3.2001 20 3

In Tabelle 5 wird die Verzögerungsspalte in $y_{t-1}^{(h)}$ umbenannt, um widerzuspiegeln, dass die Verzögerung in Bezug auf einen bestimmten Horizont generiert wird. Tabelle 5 zeigt, wie Verzögerungen, die in Bezug auf den Horizont generiert wurden, den herkömmlichen Methoden zum Generieren von Verzögerungen in den vorherigen Tabellen zugeordnet werden können.

Die Tabelle 5 ist ein Beispiel für die Datenerweiterung, die AutoML auf Trainingsdaten anwendet, um direkte Vorhersagen aus Regressionsmodellen zu ermöglichen. Wenn die Konfiguration Verzögerungsfeatures enthält, erstellt AutoML horizontabhängige Verzögerungen zusammen mit einem ganzzahligen Horizontfeature. Regressionsmodelle für AutoML-Vorhersagen können eine Vorhersage am Horizont $h$ ohne Berücksichtigung der Vorhersage bei $h-1$ treffen, im Gegensatz zu rekursiv definierten Modellen wie ARIMA.

Überlegungen zur Featurisierung der Verzögerung

Es gibt einige Überlegungen im Zusammenhang mit der Featurisierung bei Verzögerungen für ein Modell. Lesen Sie die folgenden Abschnitte, um potenzielle Aktionen für Ihr Szenario zu identifizieren.

Wachstum der Datasetgröße

Wenn AutoML horizontabhängige Verzögerungsfeatures generiert, werden dem Modelldataset neue Zeilen hinzugefügt. Die Anzahl der neuen Zeilen ist proportional zum Prognosehorizont.

Dieses Wachstum der Größe des Datasets kann bei kleineren Serverknoten oder wenn die Datasetgröße bereits groß ist, zu Fehlern aufgrund von nicht genügendem Arbeitsspeicher führen. Sie finden Lösungen zur Behebung dieses Problems in dem Abschnitt Häufig gestellte Fragen (FAQ) zur AutoML-Prognose.

Entkoppelung von Verzögerungsreihenfolge und Prognosehorizont

Die AutoML-Verzögerungsstrategie entkoppelt die Verzögerungsreihenfolge und den Prognosehorizont. Angenommen, Ihr Prognosehorizont ist sieben, und Sie möchten, dass Verzögerungsfeature von AutoML verwenden. In diesem Szenario müssen Sie die Verzögerungsreihenfolge nicht auf sieben festlegen, um die Vorhersage über einen vollständigen Prognosehorizont sicherzustellen. Da AutoML-Verzögerungen im Hinblick auf den Horizont generiert, können Sie die Verzögerungsreihenfolge auf eins festlegen. AutoML erweitert die Daten so, dass Verzögerungen einer beliebigen Reihenfolge bis zum Prognosehorizont gültig sind.