Úvod
Způsob, jakým trénujeme modely, není žádným způsobem dokonale automatizovaný proces. Trénování nevidomého spoléhání na data může vést k tomu, aby se naučila věci, které nejsou užitečné na konci, nebo aby se efektivně nenaučily věci, které jsou skutečně užitečné. Následující výukový materiál vás provede některými jednoduchými důvody, proč probíhá podurčení a přeurčení a co s tím můžete dělat.
Scénář: Školení lavinových záchranných psů
V tomto modulu použijeme následující ukázkový scénář k vysvětlení nedoučení a přeurčení. Tento scénář je navržený tak, aby poskytoval příklad toho, jak můžete tyto koncepty splnit při programování pro sebe. Mějte na paměti, že tyto zásady se obecně vztahují na téměř všechny typy modelů, nejen na ty, se kterými zde pracujeme.
Je čas, aby vaše charitativní organizace trénování nové generace psů, jak najít pěší turistiku vyhodila lavinami. V kanceláři je debata o tom, které psy jsou nejlepší; je velký pes lepší než menší pes? Měli by být psi vyškoleni, když jsou mladí, nebo když jsou vyspělejší? Naštěstí máte statistiky o záchranách provedených v posledních několika letech, na které se můžete podívat. Trénovací psi jsou ale nákladná a musíte mít jistotu, že vaše kritéria pro výběr psů zní.
Požadavky
- Znalost modelů strojového učení
Cíle výuky
V tomto modulu:
- Definujte normalizaci funkcí.
- Vytváření a práce s testovacími datovými sadami
- Vyjádřit, jak mohou testovací modely zlepšit i poškodit trénování.