Wieloklasowy składnik regresji logistycznej
W tym artykule opisano składnik w projektancie usługi Azure Machine Learning.
Użyj tego składnika, aby utworzyć model regresji logistycznej, który może służyć do przewidywania wielu wartości.
Klasyfikacja przy użyciu regresji logistycznej jest metodą uczenia nadzorowanego i dlatego wymaga oznaczonego zestawu danych. Wytrenujesz model, podając model i oznaczony etykietą zestaw danych jako dane wejściowe do składnika, takiego jak Train Model (Trenowanie modelu). Następnie wytrenowany model może służyć do przewidywania wartości dla nowych przykładów wejściowych.
Usługa Azure Machine Learning udostępnia również dwuklasowy składnik regresji logistycznej, który jest odpowiedni do klasyfikacji zmiennych binarnych lub dychotomicznych.
Informacje o regresji logistycznej wieloklasowej
Regresja logistyczna to dobrze znana metoda w statystykach, która służy do przewidywania prawdopodobieństwa wyniku i jest popularna w przypadku zadań klasyfikacji. Algorytm przewiduje prawdopodobieństwo wystąpienia zdarzenia przez dopasowanie danych do funkcji logistycznej.
W regresji logistycznej wieloklasowej klasyfikator może służyć do przewidywania wielu wyników.
Konfigurowanie regresji logistycznej wieloklasowej
Dodaj składnik Regresja logistyczna w wielu klasach do potoku.
Określ sposób trenowania modelu, ustawiając opcję Utwórz tryb trenera .
Pojedynczy parametr: użyj tej opcji, jeśli wiesz, jak skonfigurować model i podaj określony zestaw wartości jako argumenty.
Zakres parametrów: wybierz tę opcję, jeśli nie masz pewności co do najlepszych parametrów i chcesz uruchomić zamiatanie parametrów. Wybierz zakres wartości do iterowania, a hiperparametry modelu dostrajania iterują we wszystkich możliwych kombinacjach podanych ustawień w celu określenia hiperparametrów, które generują optymalne wyniki.
Tolerancja optymalizacji, określ wartość progową dla zbieżności optymalizatora. Jeśli poprawa między iteracjami jest mniejsza niż próg, algorytm zatrzymuje się i zwraca bieżący model.
L1 waga regularyzacji, waga regularyzacji L2: Wpisz wartość do użycia dla parametrów regularyzacji L1 i L2. W obu przypadkach zalecana jest wartość niezerowa.
Regularyzacja to metoda zapobiegania nadmiernemu dopasowaniu przez ukaranie modeli z skrajnymi wartościami współczynników. Regularyzacja działa przez dodanie kary powiązanej z wartościami współczynników do błędu hipotezy. Dokładny model o skrajnych wartościach współczynników byłby bardziej ukarany, ale mniej dokładny model z bardziej konserwatywnymi wartościami byłby karany mniej.
Regularyzacja L1 i L2 ma różne efekty i zastosowania. L1 można stosować do rozrzednych modeli, co jest przydatne podczas pracy z danymi o wysokiej wymiarach. Z kolei regularyzacja L2 jest preferowana w przypadku danych, które nie są rozrzedłe. Ten algorytm obsługuje liniową kombinację wartości regularyzacji L1 i L2: to znaczy, jeśli
x = L1
iy = L2
,ax + by = c
definiuje liniowy zakres terminów regularyzacji.Różne kombinacje liniowe terminów L1 i L2 zostały opracowane dla modeli regresji logistycznej, takich jak regularyzacja sieci elastycznej.
Inicjator liczb losowych: wpisz wartość całkowitą, która ma być używana jako inicjator dla algorytmu, jeśli wyniki mają być powtarzalne w przypadku przebiegów. W przeciwnym razie wartość zegara systemowego jest używana jako inicjator, co może spowodować nieco inne wyniki w uruchomieniach tego samego potoku.
Połącz oznaczony zestaw danych i wytrenuj model:
Jeśli ustawisz opcję Utwórz tryb trenera na Pojedynczy parametr, połącz oznakowany zestaw danych i składnik Train Model (Trenowanie modelu).
Jeśli ustawisz opcję Utwórz tryb trenera na Wartość Zakres parametrów, połącz oznakowany zestaw danych i wytrenuj model przy użyciu hiperparametrów dostrajania modelu.
Uwaga
Jeśli przekażesz zakres parametrów do trenowania modelu, zostanie użyta tylko wartość domyślna na liście pojedynczych parametrów.
Jeśli przekażesz pojedynczy zestaw wartości parametrów do składnika hiperparametrów modelu dostrajania , gdy oczekuje ona zakresu ustawień dla każdego parametru, zignoruje wartości i używa wartości domyślnych dla ucznia.
Jeśli wybierzesz opcję Zakres parametrów i wprowadzisz pojedynczą wartość dla dowolnego parametru, określona pojedyncza wartość jest używana w trakcie zamiatania, nawet jeśli inne parametry zmienią się w zakresie wartości.
Prześlij potok.
Następne kroki
Zobacz zestaw składników dostępnych dla usługi Azure Machine Learning.