Co je automatizované strojové učení (AutoML)?
Automatizované strojové učení (AutoML) automatizuje proces použití strojového učení na data. Vzhledem k datové sadě můžete autoML spustit a iterovat v různých transformacích dat, algoritmech strojového učení a hyperparametrech a vybrat nejlepší model.
Poznámka
Tento článek se týká rozhraní API ML.NET AutoML, které je aktuálně ve verzi Preview. Materiál se může změnit.
Jak AutoML funguje?
Obecně platí, že pracovní postup pro trénování modelů strojového učení je následující:
- Definování problému
- Shromažďování dat
- Předběžné zpracování dat
- Trénování modelu
- Vyhodnocení modelu
Předběžné zpracování, trénování a hodnocení jsou experimentální a iterativní proces, který vyžaduje více pokusů, dokud nedosáhnete uspokojivých výsledků. Vzhledem k tomu, že se tyto úlohy často opakují, může autoML pomoct tyto kroky automatizovat. Kromě automatizace se techniky optimalizace používají během procesu trénování a vyhodnocení k vyhledání a výběru algoritmů a hyperparametrů.
Kdy mám použít AutoML?
Ať už teprve začínáte se strojovým učením nebo jste zkušený uživatel, AutoML poskytuje řešení pro automatizaci procesu vývoje modelu.
- začátečníky – Pokud s strojovém učení začínáte, AutoML zjednodušuje proces vývoje modelu tím, že poskytuje sadu výchozích hodnot, které snižují počet rozhodnutí, která musíte udělat při trénování modelu. V tom se můžete soustředit na data a na problém, který se pokoušíte vyřešit, a nechat AutoML udělat zbytek.
- zkušených uživatelů – pokud máte zkušenosti se strojovým učením, můžete přizpůsobit, nakonfigurovat a rozšířit výchozí hodnoty poskytované službou AutoML na základě vašich potřeb a přitom využívat možnosti automatizace.
AutoML v ML.NET
- Featurizer – rozhraní API pro usnadnění automatizace předběžného zpracování dat.
- Zkouška - Jeden běh optimalizace hyperparametrů.
- Experiment – kolekce zkušebních verzí AutoML ML.NET poskytuje rozhraní API vysoké úrovně pro vytváření experimentů, které nastaví výchozí hodnoty pro jednotlivé součásti konfigurovatelného kanálu, vyhledávacího prostoru a ladicího mechanismu.
- prostor hledání – rozsah dostupných možností pro výběr hyperparametrů.
-
Tuner – algoritmy používané pro optimalizaci hyperparametrů. ML.NET podporuje následující tunery:
- Frugal Tuner – implementace frugalní optimalizace pro hyperparametry související s náklady, která bere v úvahu tréninkové náklady.
- Eci Cost Frugal Tuner – Implementace úsporného nákladového tuneru pro hierarchické prohledávací prostory. Výchozí tuner používaný AutoML.
- SMAC – tuner, který používá náhodné lesy ke zpracování Bayesovské optimalizace.
- mřížkové vyhledávání - tuner, který je nejvhodnější pro malé vyhledávací prostory.
- Náhodné vyhledávání
- Zaměnitelný odhadce – ML.NET odhadce, který obsahuje vyhledávací prostor.
- Zaměnitelný Kanál - Kanál ML.NET, který obsahuje jeden nebo více zaměnitelných odhadovačů.
- Trial Runner - komponenta AutoML, která používá prohledávatelné pipeline a nastavení testů k vygenerování výsledků testů z trénování a vyhodnocení modelu.
Doporučuje se, aby začátečníci začali s výchozími nastaveními poskytovanými rozhraním API pro experimenty vysoké úrovně. Pro zkušenější uživatele, kteří hledají možnosti přizpůsobení, použijte sweepable estimátor, sweepable pipeline, vyhledávací prostor, zkušební spouštěč a komponenty tuneru.
Další informace o tom, jak začít s rozhraním API AutoML, najdete v průvodci Jak používat rozhraní API ML.NET automatizovaného strojového učení (AutoML).
Podporované úlohy
AutoML poskytuje předkonfigurované výchozí hodnoty pro následující úlohy:
- Binární klasifikace
- Klasifikace s více třídami
- Regrese
V případě jiných úkolů můžete vytvořit vlastní spouštěč zkušebních verzí, který tyto scénáře povolí. Další informace najdete v návodu k použití rozhraní API ML.NET automatizovaného strojového učení (AutoML).