Prognózování (bezserverové) pomocí AutoML
Důležitý
Tato funkce je ve verzi Public Preview.
V tomto článku se dozvíte, jak spustit bezserverový experiment prognózování pomocí uživatelského rozhraní pro trénování modelu Mosaic AI.
Mosaic AI Model Training - prognózování zjednodušuje práci s daty časových řad tím, že automaticky vybírá nejlepší algoritmus a hyperparametry, a to vše při běhu na plně spravovaných výpočetních prostředcích.
Pokud chcete porozumět rozdílu mezi bezserverovými prognózami a klasickými prognózami výpočetních prostředků, přečtěte si téma Bezserverové prognózování a klasické prognózování výpočetních prostředků.
Požadavky
Tréninková data s časovými řadami column, uložené jako Unity Catalogtable.
Pokud má pracovní prostor povolenou zabezpečenou bránu výchozího přenosu dat (SEG),
pypi.org
je nutné přidat do povolené doménylist. Viz Správa zásad sítě pro řízení výchozího přenosu dat bez serveru.
Vytvoření experimentu prognózování s uživatelským rozhraním
Přejděte na cílovou stránku Azure Databricks a na bočním panelu klikněte na Experimenty.
Na dlaždici PrognózováníselectZahájit trénování.
trénovacích dat z Unity , ke kterým máte přístup. -
Čas column: Selectcolumn obsahující časová období pro časovou řadu.
columns musí být typu
timestamp
nebodate
. - Frekvence prognózy: Select časová jednotka určující frekvenci vašich vstupních dat. Například minuty, hodiny, dny, měsíce. Tím se určuje členitost časové řady.
- horizont prognózy: Určete, kolik jednotek vybrané frekvence se má prognózovat do budoucna. Společně s frekvencí prognózy se definují jak časové jednotky, tak i počet časových jednotek, které se mají prognózovat.
Poznámka
Aby bylo možné použít algoritmus auto-ARIMA, musí mít časová řada běžnou frekvenci where interval mezi libovolnými dvěma body musí být v průběhu časových řad stejný. AutoML zpracovává chybějící časové kroky tím, že vyplní values předchozí hodnotou.
-
Čas column: Selectcolumn obsahující časová období pro časovou řadu.
columns musí být typu
Cíl předpovědi Select a column, který chcete, aby model předpověděl.
Volitelně můžete zadat cestu k datům Unity CatalogtablePrediction pro uložení výstupních prognóz.
Select registrace modelu Unity umístění a názvu Catalog.
Volitelně setrozšířené možnosti:
- název experimentu: Zadejte název experimentu MLflow.
- časové řady identifiercolumns – pro účely prognózování s více řadami, selectcolumn(s), které identifikují jednotlivé časové řady. Databricks seskupuje data podle těchto columns jako různé časové řady a trénuje model pro každou řadu nezávisle.
- primární metrika: Vyberte si primární metriku použitou k vyhodnocení a select nejlepšího modelu.
- trénovací rozhraní: Vyberte architektury pro AutoML, které chcete prozkoumat.
- Rozdělení column: Select rozdělení obsahující vlastní data column. Values musí být "train", "validate" nebo "test"
- column hmotnosti: Zadejte column, které se mají použít pro vážení časových řad. Všechny vzorky pro danou časovou řadu musí mít stejnou váhu. Hmotnost musí být v rozsahu [0, 10000].
- prázdninová oblast: Select prázdninová oblast, která se použije jako kovariáty při trénování modelu.
- Časový limit: Set maximální doba trvání experimentu AutoML.
Spuštění experimentu a monitorování výsledků
Chcete-li spustit experiment AutoML, klepněte na tlačítko Zahájit trénování. Na stránce pro trénování experimentu můžete udělat toto:
- Experiment můžete kdykoli zastavit.
- Spuštění monitoru
- Přejděte na stránku běhu pro libovolné spuštění.
Zobrazení výsledků nebo použití nejlepšího modelu
Po dokončení trénování se výsledky předpovědi uloží do specifikované Delta table a nejlepší model se zaregistruje do Unity Catalog.
Na stránce experimentů si můžete vybrat z následujících kroků:
- Select Zobrazit předpovědi zobrazit výsledky prognózování table.
- Select dávkový inferenční poznámkový blok pro otevření automaticky vygenerovaného poznámkového bloku pro dávkovou inferenci s použitím nejlepšího modelu.
- Select Vytvořte koncový bod pro obsluhu pro nasazení nejlepšího modelu do koncového bodu pro obsluhu modelu.
bezserverové prognózování versus klasické prognózování výpočetních prostředků
Následující table shrnuje rozdíly mezi bezserverovým prognózováním a prognózováním s klasickými výpočetními
Funkce | Prognózování bez serveru | Klasické prognózování výpočetní techniky |
---|---|---|
Výpočetní infrastruktura | Azure Databricks spravuje konfiguraci výpočetních prostředků a automaticky optimalizuje náklady a výkon. | Výpočetní prostředky nakonfigurované uživatelem |
Vládnutí | Modely a artefakty zaregistrované v Unity Catalog | Úložiště souborů pracovního prostoru nakonfigurované uživatelem |
Výběr algoritmu | statistické modely plus algoritmus neurální sítě hlubokého učení DeepAR | statistické modely |
Integrace úložiště funkcí | Nepodporováno | podporované |
Automaticky generované poznámkové bloky | Poznámkový blok pro odvození služby Batch | Zdrojový kód pro všechny zkušební verze |
Jednoklikový model obsluhující nasazení | Podporovaný | Nepodporovaný |
Vlastní rozdělení trénování, ověřování a testování | Podporovaný | Nepodporováno |
Vlastní váhy pro jednotlivé časové řady | Podporovaný | Nepodporováno |