Vertragingsfuncties voor het voorspellen van tijdreeksen in AutoML
In dit artikel wordt beschreven hoe automatische machine learning (AutoML) in Azure Machine Learning vertragings- en rolling windowaggregatiefuncties maakt om u te helpen bij het voorspellen van regressiemodellen van tijdreeksen. De AutoML-functies gebruiken historische modelgegevens die de nauwkeurigheid van het model aanzienlijk kunnen verhogen door het model te helpen correlatiepatronen in de tijd te leren.
Zie Overzicht van prognosemethoden in AutoML als u meer wilt weten over de prognosemethodologie in AutoML. Zie AutoML instellen voor het trainen van een tijdreeksprognosemodel met de SDK en CLI voor meer informatie over trainingsvoorbeelden voor het voorspellen van modellen in AutoML.
Vertragingsmetralisatie in AutoML
AutoML genereert vertragingsfuncties die overeenkomen met de prognose horizon. In deze sectie wordt de vertragingsmetralisatie in AutoML voor een model verkend met een prognoseperiode van drie en de volgorde van de doelvertraging van één. De volgende tabellen bevatten de modelgegevens en vertragingsfuncties voor een maandelijkse tijdreeks.
Tabel 1: Oorspronkelijke tijdreeks
Datum | $y_t$ |
---|---|
1/1/2001 | 0 |
2/1/2001 | 10 |
3/1/2001 | 20 |
4/1/2001 | 30 |
5/1/2001 | 40 |
6/1/2001 | 50 |
De eerste stap genereert alleen de vertragingsfunctie voor de horizon $h=1$. De volgende tabellen laten zien waarom het proces afzonderlijke horizons gebruikt om de vertragingsmetralisatie te voltooien.
Tabel 2: Vertragingsmetralisatie voor horizon $h=1$
Datum | $y_t$ | Oorprong | $y_{t-1}$ | $h$ |
---|---|---|---|---|
1/1/2001 | 0 | 12/1/2000 | - | 1 |
2/1/2001 | 10 | 1/1/2001 | 0 | 1 |
3/1/2001 | 20 | 2/1/2001 | 10 | 1 |
4/1/2001 | 30 | 3/1/2001 | 20 | 1 |
5/1/2001 | 40 | 4/1/2001 | 30 | 1 |
6/1/2001 | 50 | 5/1/2001 | 40 | 1 |
AutoML genereert de gegevens in tabel 2 van de gegevens in tabel 1 door de kolom $y_t$ omlaag te verplaatsen met één observatie. Tabellen 2 tot en met 5 bevatten de kolom Origin om de datums weer te geven van waaruit de vertragingsfuncties afkomstig zijn.
In de volgende stap wordt de vertragingsfunctie voor de prognose horizon alleen $h=2$ gegenereerd.
Tabel 3: Vertragingsmetralisatie voor de prognose horizon $h=2$
Datum | $y_t$ | Oorprong | $y_{t-2}$ | $h$ |
---|---|---|---|---|
1/1/2001 | 0 | 11/1/2000 | - | 2 |
2/1/2001 | 10 | 12/1/2000 | - | 2 |
3/1/2001 | 20 | 1/1/2001 | 0 | 2 |
4/1/2001 | 30 | 2/1/2001 | 10 | 2 |
5/1/2001 | 40 | 3/1/2001 | 20 | 2 |
6/1/2001 | 50 | 4/1/2001 | 30 | 2 |
AutoML genereert de gegevens in tabel 3 van de gegevens in tabel 1 door de kolom $y_t$ omlaag te verplaatsen met twee waarnemingen.
In de volgende stap wordt de vertragingsfunctie voor de prognose horizon alleen $h=3$ gegenereerd.
Tabel 4: Vertragingsmetralisatie voor de prognose horizon $h=3$
Datum | $y_t$ | Oorprong | $y_{t-3}$ | $h$ |
---|---|---|---|---|
1/1/2001 | 0 | 10/1/2000 | - | 3 |
2/1/2001 | 10 | 11/1/2000 | - | 3 |
3/1/2001 | 20 | 12/1/2000 | - | 3 |
4/1/2001 | 30 | 1/1/2001 | 0 | 3 |
5/1/2001 | 40 | 2/1/2001 | 10 | 3 |
6/1/2001 | 50 | 3/1/2001 | 20 | 3 |
Met de laatste stap worden de gegevens samengevoegd in tabellen 1, 2 en 3 en worden de rijen opnieuw gerangschikt.
Tabel 5: Vertragingsmetralisatie voltooid
Datum | $y_t$ | Oorprong | $y_{t-1}^{(h)}$ | $h$ |
---|---|---|---|---|
1/1/2001 | 0 | 12/1/2000 | - | 1 |
1/1/2001 | 0 | 11/1/2000 | - | 2 |
1/1/2001 | 0 | 10/1/2000 | - | 3 |
2/1/2001 | 10 | 1/1/2001 | 0 | 1 |
2/1/2001 | 10 | 12/1/2000 | - | 2 |
2/1/2001 | 10 | 11/1/2000 | - | 3 |
3/1/2001 | 20 | 2/1/2001 | 10 | 1 |
3/1/2001 | 20 | 1/1/2001 | 0 | 2 |
3/1/2001 | 20 | 12/1/2000 | - | 3 |
4/1/2001 | 30 | 3/1/2001 | 20 | 1 |
4/1/2001 | 30 | 2/1/2001 | 10 | 2 |
4/1/2001 | 30 | 1/1/2001 | 0 | 3 |
5/1/2001 | 40 | 4/1/2001 | 30 | 1 |
5/1/2001 | 40 | 3/1/2001 | 20 | 2 |
5/1/2001 | 40 | 2/1/2001 | 10 | 3 |
6/1/2001 | 50 | 4/1/2001 | 40 | 1 |
6/1/2001 | 50 | 4/1/2001 | 30 | 2 |
6/1/2001 | 50 | 3/1/2001 | 20 | 3 |
In tabel 5 wordt de naam van de vertragingskolom gewijzigd in $y_{t-1}^{(h)}$ om aan te geven dat de vertraging wordt gegenereerd met betrekking tot een specifieke horizon. Tabel 5 laat zien hoe vertragingen met betrekking tot de horizon kunnen worden toegewezen aan de conventionele manieren om vertragingen in de vorige tabellen te genereren.
Tabel 5 is een voorbeeld van de gegevensvergroting die AutoML toepast op trainingsgegevens om directe prognose van regressiemodellen mogelijk te maken. Wanneer de configuratie vertragingsfuncties bevat, maakt AutoML horizonafhankelijke vertragingen samen met een functie voor een horizon met een geheel getalwaarde. AutoML-voorspellingsmodellen voor regressie kunnen een voorspelling doen op horizon $h$ zonder rekening te houden met de voorspelling op $h-1$, in tegenstelling tot recursief gedefinieerde modellen zoals ARIMA.
Overwegingen voor vertragingsmetralisatie
Er zijn enkele overwegingen met betrekking tot vertragingsmetralisatie voor een model. Bekijk de volgende secties om mogelijke acties voor uw scenario te identificeren.
Groei van gegevenssetgrootte
Wanneer AutoML horizonafhankelijke vertragingsfuncties genereert, worden nieuwe rijen toegevoegd aan de modelgegevensset. Het aantal nieuwe rijen is evenredig aan de prognosehorizor.
De groei in de grootte van de gegevensset kan leiden tot fouten met onvoldoende geheugen op kleinere rekenknooppunten of wanneer de grootte van de gegevensset al groot is. U vindt oplossingen om dit probleem op te lossen in de veelgestelde vragen (FAQ) voor AutoML-prognoses.
Loskoppelen van vertragingsvolgorde en prognosehorizon
Met de strategie voor vertraging in AutoML worden de vertragingsvolgorde en de prognosehorizon losgekoppeld. Stel dat uw prognose horizon zeven is en u wilt dat AutoML vertragingsfuncties gebruikt. In dit scenario hoeft u de vertragingsvolgorde niet in te stellen op zeven om voorspellingen te garanderen over een volledige prognoseperiode. Omdat AutoML vertragingen genereert met betrekking tot de horizon, kunt u de vertragingsvolgorde instellen op één. Met AutoML worden de gegevens vergroot, zodat vertragingen in een willekeurige volgorde geldig zijn tot aan de prognoseperiode.