Wprowadzenie
W uczeniu maszynowym algorytmy są używane do trenowania modeli, które przewidują nieznane etykiety nowych danych na podstawie korelacji między znanymi etykietami i funkcjami znajdującymi się w danych treningowych. W zależności od używanego algorytmu może być konieczne określenie hiperparametrów w celu skonfigurowania sposobu trenowania modelu. Na przykład algorytm regresji logistycznej używa hiperparametru współczynnika regularyzacji , aby przeciwdziałać nadmiernemu dopasowaniu; a modele sieci neuronowych uczenia głębokiego używają hiperparametrów, takich jak szybkość uczenia, aby kontrolować, jak wagi są dostosowywane podczas trenowania.
Uwaga
Machine Edukacja to dziedzina akademicka z własną konkretną terminologią. Analitycy danych odwołują się do wartości określonych na podstawie funkcji trenowania jako parametrów, więc dla wartości używanych do konfigurowania zachowania trenowania, ale które nie pochodzą z danych treningowych , dlatego termin hiperparametr jest wymagany.
Wartości hiperparametryczne wybrane dla danego algorytmu mogą mieć znaczący wpływ na model, który trenuje; dlatego wybranie odpowiednich wartości hiperparametrów może mieć różnicę między modelem, który dobrze przewiduje, gdy jest używany z nowymi danymi, a modelem, który nie jest.
W usłudze Azure Databricks możesz użyć biblioteki Hyperopt do zautomatyzowania dostrajania hiperparametrów. Proces, w którym wielokrotnie trenujesz i oceniasz modele przy użyciu różnych kombinacji hiperparametrów, dopóki nie znajdziesz wartości, które działają najlepiej dla danych.