Shrnutí
V tomto modulu jsme probrali několik důležitých nových žargonů. Pojďme si zrekapitulovat, co jsme se naučili:
Cílem strojového učení je najít vzory v datech a pomocí těchto vzorů provádět odhady.
Strojové učení se liší od normálního vývoje softwaru v tom, že místo vlastní intuitivně používáme speciální kód, abychom zlepšili, jak dobře software funguje.
Proces učení koncepčně používá čtyři komponenty:
- Data, která jsou informace, ze kterých se chceme poučit.
- Model, který vytváří odhady o datech.
- Cílem, který se model snaží dosáhnout.
- Optimalizátor, extra kód, který mění model v závislosti na jeho výkonu.
Data si můžete představit jako funkce a popisky. Funkce odpovídají potenciálním vstupům modelu, zatímco popisky odpovídají výstupům modelu nebo požadovaným výstupům modelu.
Pandas a Plotly jsou výkonné nástroje pro zkoumání datových sad v Pythonu.
Jakmile máme natrénovaný model, můžeme ho uložit na disk pro pozdější použití.