Wprowadzenie
W uczeniu maszynowym modele są trenowane w celu przewidywania nieznanych etykiet dla nowych danych na podstawie korelacji między znanymi etykietami i funkcjami znajdującymi się w danych treningowych. W zależności od używanego algorytmu może być konieczne określenie hiperparametrów w celu skonfigurowania sposobu trenowania modelu.
Na przykład algorytm regresji logistycznej używa współczynnika uregulowania hiperparametru w celu przeciwdziałania nadmiernemu dopasowaniu; i techniki uczenia głębokiego dla splotowych sieci neuronowych (CNN) używają hiperparametrów, takich jak szybkość uczenia , aby kontrolować, jak wagi są dostosowywane podczas trenowania, i rozmiar partii, aby określić, ile elementów danych jest uwzględnionych w każdej partii szkoleniowej.
Notatka
Uczenie maszynowe to dziedzina akademicka z własną konkretną terminologią. Analitycy danych odwołują się do wartości określonych na podstawie funkcji trenowania jako parametrów , dlatego dla wartości używanych do konfigurowania zachowania trenowania, ale które nie są pochodzące z danych treningowych — stąd termin hiperparametr.
Wybór wartości hiperparametrów może znacząco wpłynąć na wynikowy model, co sprawia, że ważne jest, aby wybrać najlepsze możliwe wartości dla określonych danych i predykcyjnych celów wydajności.
Dostrajanie hiperparametrów
dostrajanie hiperparametrów jest realizowane przez trenowanie wielu modeli przy użyciu tego samego algorytmu i danych treningowych, ale różnych wartości hiperparametrów. Model uzyskany z każdego przebiegu trenowania jest następnie oceniany w celu określenia metryki efektywności, którą chcesz zoptymalizować (na przykład dokładności), a wybrany jest model o najlepszej wydajności.
W usłudze Azure Machine Learning można dostroić hiperparametry, przesyłając skrypt jako zadanie przeszukiwania. Operacja przeszukiwania uruchomi próba dla każdej kombinacji hiperparametrów do przetestowania. Każda wersja próbna używa skryptu trenowania z sparametryzowanymi wartościami hiperparametrów do trenowania modelu i rejestruje docelową metrykę wydajności osiągniętą przez wytrenowany model.
Cele nauki
W tym module dowiesz się, jak wykonywać następujące czynności:
- Zdefiniuj przestrzeń wyszukiwania hiperparametrów.
- Konfigurowanie próbkowania hiperparametrów.
- Wybierz zasady wczesnego zakończenia.
- Uruchamianie zadania zamiatania.