Úvod
Ve strojovém učení se algoritmy používají k trénování modelů, které předpovídají neznámé popisky nových dat na základě korelací mezi známými popisky a funkcemi nalezené v trénovacích datech. V závislosti na použitém algoritmu možná budete muset zadat hyperparametry ke konfiguraci způsobu trénování modelu. Například algoritmus logistické regrese používá hyperparametr míry regularizace k potlačení přeurčení. Modely neurální sítě hlubokého učení používají hyperparametry, jako je rychlost učení, k řízení způsobu úpravy hmotností během trénování.
Poznámka:
Strojové Učení je akademické pole s vlastní konkrétní terminologií. Datoví vědci odkazují na hodnoty určené z trénovacích funkcí jako parametrů, takže pro hodnoty, které se používají ke konfiguraci chování trénování, ale které nejsou odvozené z trénovacích dat , proto termín hyperparametr vyžaduje jiný termín.
Hodnoty hyperparametrů, které vyberete pro daný algoritmus, mohou mít významný vliv na model, který trénuje; Takže volba správných hodnot hyperparametrů může udělat rozdíl mezi modelem, který dobře předpovídá při použití s novými daty, a modelem, který ne.
V Azure Databricks můžete pomocí knihovny Hyperopt automatizovat ladění hyperparametrů. Proces, ve kterém opakovaně trénujete a vyhodnocujete modely pomocí různých kombinací hyperparametrů, dokud nenajdete hodnoty, které jsou pro vaše data nejvhodnější.