Ulepszanie modeli za pomocą hiperparametrów

Ukończone

Proste modele z małymi zestawami danych często można zmieścić w jednym kroku, podczas gdy większe zestawy danych i bardziej złożone modele muszą być dopasowywane wielokrotnie przy użyciu modelu z danymi treningowymi i porównywania danych wyjściowych z oczekiwaną etykietą. Jeśli przewidywanie jest wystarczająco dokładne, rozważmy wytrenowany model. Jeśli tak nie jest, ponownie dostosujemy model i pętlę.

Hiperparametry to wartości, które zmieniają sposób dopasowania modelu podczas tych pętli. Na przykład szybkość nauki to hiperparametr, który określa, ile model jest dostosowywany podczas każdego cyklu treningowego. Wysoki wskaźnik uczenia oznacza, że model może być trenowany szybciej; ale jeśli jest zbyt wysoka, korekty mogą być tak duże, że model nigdy nie jest "precyzyjnie dostrojony" i nie jest optymalny.

Wstępne przetwarzanie danych

Przetwarzanie wstępne odnosi się do zmian wstępnych w danych przed przekazaniem ich do modelu. Wcześniej przeczytaliśmy, że przetwarzanie wstępne może obejmować czyszczenie zestawu danych. Chociaż jest to ważne, przetwarzanie wstępne może również obejmować zmianę formatu danych, aby ułatwić korzystanie z modelu. Na przykład dane opisane jako "czerwone", "pomarańczowe", "żółte", "wapno" i "zielone" mogą działać lepiej, jeśli przekonwertowane na format bardziej natywny dla komputerów, takie jak liczby z informacją o ilości czerwonej i ilości zielonego.

Funkcje skalowania

Najczęstszym krokiem przetwarzania wstępnego jest skalowanie funkcji, dzięki czemu dzielą się między zerami i jednym. Na przykład waga roweru i odległość, którą osoba podróżuje na rowerze, może być dwiema zupełnie różnymi liczbami, ale przez skalowanie obu liczb do zera i jednego umożliwia modelom bardziej efektywne uczenie się z danych.

Używanie kategorii jako funkcji

W uczeniu maszynowym można również używać cech kategorii, takich jak "rower", "deskorolka" lub "samochód". Te funkcje są reprezentowane przez 0 lub 1 wartości w wektorach jednogrzanych; wektory, które mają wartość 0 lub 1 dla każdej możliwej wartości. Na przykład rower, deskorolka i samochód mogą być odpowiednio (1,0,0), (0,1,0) i (0,0,1).