Wprowadzenie
W uczeniu maszynowym modele są trenowane w celu przewidywania nieznanych etykiet dla nowych danych na podstawie korelacji między znanymi etykietami i funkcjami znajdującymi się w danych treningowych. W zależności od używanego algorytmu może być konieczne określenie hiperparametrów w celu skonfigurowania sposobu trenowania modelu.
Na przykład algorytm regresji logistycznej używa hiperparametru współczynnika regularyzacji, aby przeciwdziałać nadmiernemu dopasowaniu; a techniki uczenia głębokiego dla splotowych sieci neuronowych (CNN) używają hiperparametrów, takich jak szybkość uczenia, aby kontrolować, jak wagi są dostosowywane podczas trenowania, oraz rozmiar partii w celu określenia, ile elementów danych jest uwzględnionych w każdej partii szkoleniowej.
Uwaga
Machine Edukacja to dziedzina akademicka z własną konkretną terminologią. Analitycy danych odwołują się do wartości określonych na podstawie funkcji trenowania jako parametrów, więc dla wartości używanych do konfigurowania zachowania trenowania, ale które nie pochodzą z danych treningowych , dlatego termin hiperparametr jest wymagany.
Wybór wartości hiperparametrów może znacząco wpłynąć na wynikowy model, co sprawia, że ważne jest, aby wybrać najlepsze możliwe wartości dla określonych danych i predykcyjnych celów wydajności.
Dostrajanie hiperparametrów
Dostrajanie hiperparametryczne jest realizowane przez trenowanie wielu modeli przy użyciu tego samego algorytmu i danych treningowych, ale różnych wartości hiperparametrów. Wynikowy model z każdego przebiegu trenowania jest następnie oceniany w celu określenia metryki wydajności, dla której chcesz zoptymalizować (na przykład dokładność), a wybrany jest model o najlepszej wydajności.
W usłudze Azure Machine Edukacja można dostroić hiperparametry, przesyłając skrypt jako zadanie zamiatania. Zadanie zamiatania uruchomi wersję próbną dla każdej kombinacji hiperparametrów do przetestowania. Każda wersja próbna używa skryptu trenowania z sparametryzowanymi wartościami hiperparametrów do trenowania modelu i rejestruje docelową metrykę wydajności osiągniętą przez wytrenowany model.
Cele szkolenia
Ten moduł obejmuje następujące zagadnienia:
- Zdefiniuj przestrzeń wyszukiwania hiperparametrów.
- Konfigurowanie próbkowania hiperparametrów.
- Wybierz zasady wczesnego zakończenia.
- Uruchamianie zadania zamiatania.