Introduktion

Slutförd

Inom maskininlärning används algoritmer för att träna modeller som förutsäger okända etiketter för nya data baserat på korrelationer mellan kända etiketter och funktioner som finns i träningsdata. Beroende på vilken algoritm som används kan du behöva ange hyperparametrar för att konfigurera hur modellen tränas. Den logistiska regressionsalgoritmen använder till exempel en hyperparameter för regulariseringshastighet för att motverka överanpassning. Och modeller för neurala nätverk med djupinlärning använder hyperparametrar som inlärningshastighet för att styra hur vikter justeras under träning.

Kommentar

Maskininlärning är ett akademiskt område med sin egen terminologi. Dataexperter refererar till de värden som bestäms från träningsfunktionerna som parametrar, så en annan term krävs för värden som används för att konfigurera träningsbeteende men som inte härleds från träningsdata – därav termen hyperparameter.

De hyperparametervärden som du väljer för en viss algoritm kan ha en betydande effekt på modellen som den tränar. så att välja rätt hyperparametervärden kan göra skillnaden mellan en modell som förutsäger väl när den används med nya data och en modell som inte gör det.

I Azure Databricks kan du använda Hyperopt-biblioteket för att automatisera hyperparameterjustering. En process där du upprepade gånger tränar och utvärderar modeller med hjälp av olika kombinationer av hyperparametrar tills du hittar de värden som fungerar bäst för dina data.