Udostępnij za pośrednictwem


Dwuklasowy składnik maszyny wektorowej obsługi

W tym artykule opisano składnik w projektancie usługi Azure Machine Learning.

Użyj tego składnika, aby utworzyć model oparty na algorytmie maszyny wektorowej obsługi.

Maszyny wektorów nośnych (SVM) to dobrze zbadana klasa nadzorowanych metod uczenia. Ta konkretna implementacja jest odpowiednia do przewidywania dwóch możliwych wyników na podstawie zmiennych ciągłych lub kategorycznych.

Po zdefiniowaniu parametrów modelu przeszkolić model przy użyciu składników trenowania i podaniu oznakowanego zestawu danych zawierającego etykietę lub kolumnę wyniku.

Informacje o maszynach wektorów nośnych

Maszyny wektorów nośnych należą do najwcześniejszych algorytmów uczenia maszynowego, a modele SVM zostały użyte w wielu aplikacjach— od pobierania informacji do klasyfikacji tekstu i obrazów. Maszyny wektorów nośnych mogą służyć zarówno do zadań klasyfikacji, jak i regresji.

Ten model SVM to nadzorowany model uczenia, który wymaga oznaczonych etykietami danych. W procesie trenowania algorytm analizuje dane wejściowe i rozpoznaje wzorce w przestrzeni funkcji wielowymiarowej nazywanej hiperpłaszyzną. Wszystkie przykłady danych wejściowych są reprezentowane jako punkty w tym obszarze i są mapowane na kategorie danych wyjściowych w taki sposób, że kategorie są podzielone przez jak najszerszą i wyraźną lukę, jak to możliwe.

W przypadku przewidywania algorytm SVM przypisuje nowe przykłady do jednej lub drugiej kategorii, mapując je na tę samą przestrzeń.

Sposób konfigurowania

W przypadku tego typu modelu zaleca się znormalizowanie zestawu danych przed użyciem go do trenowania klasyfikatora.

  1. Dodaj składnik Two-Class Support Vector Machine do potoku.

  2. Określ sposób trenowania modelu, ustawiając opcję Utwórz tryb trenera .

    • Pojedynczy parametr: jeśli wiesz, jak skonfigurować model, możesz podać określony zestaw wartości jako argumenty.

    • Zakres parametrów: jeśli nie masz pewności co do najlepszych parametrów, możesz znaleźć optymalne parametry przy użyciu składnika Dostrajanie hiperparametrów modelu. Podajesz pewien zakres wartości, a trener iteruje wiele kombinacji ustawień, aby określić kombinację wartości, które dają najlepszy wynik.

  3. W polu Liczba iteracji wpisz liczbę, która określa liczbę iteracji używanych podczas kompilowania modelu.

    Ten parametr może służyć do kontrolowania kompromisu między szybkością trenowania i dokładnością.

  4. W polu Lambda wpisz wartość, która ma być używana jako waga dla uregulowania L1.

    Ten współczynnik uregulowania może służyć do dostrajania modelu. Większe wartości karzeją bardziej złożone modele.

  5. Wybierz opcję Normalizuj funkcje, jeśli chcesz znormalizować funkcje przed szkoleniem.

    W przypadku zastosowania normalizacji przed trenowaniem punkty danych są wyśrodkowane na średniej i skalowane tak, aby miały jedną jednostkę odchylenia standardowego.

  6. Wybierz opcję Project to the unit sphere (Projekt do sfery jednostkowej), aby znormalizować współczynniki.

    Prognozowanie wartości w przestrzeni jednostkowej oznacza, że przed trenowaniem punkty danych są wyśrodkowane na poziomie 0 i skalowane, aby mieć jedną jednostkę odchylenia standardowego.

  7. W inicjatorze liczby losowej wpisz wartość całkowitą, która ma być używana jako inicjator, jeśli chcesz zapewnić powtarzalność między przebiegami. W przeciwnym razie wartość zegara systemowego jest używana jako inicjator, co może spowodować nieco inne wyniki w przebiegach.

  8. Połącz oznaczony zestaw danych i wytrenuj model:

    • Jeśli ustawisz opcję Utwórz tryb trenera na Pojedynczy parametr, połącz oznakowany zestaw danych i składnik Train Model (Trenowanie modelu).

    • Jeśli ustawisz opcję Utwórz tryb trenera na Wartość Zakres parametrów, połącz oznakowany zestaw danych i wytrenuj model przy użyciu hiperparametrów dostrajania modelu.

    Uwaga

    Jeśli przekażesz zakres parametrów do trenowania modelu, zostanie użyta tylko wartość domyślna na liście pojedynczych parametrów.

    Jeśli przekażesz pojedynczy zestaw wartości parametrów do składnika hiperparametrów modelu dostrajania , gdy oczekuje ona zakresu ustawień dla każdego parametru, zignoruje wartości i używa wartości domyślnych dla ucznia.

    Jeśli wybierzesz opcję Zakres parametrów i wprowadzisz pojedynczą wartość dla dowolnego parametru, określona pojedyncza wartość jest używana w trakcie zamiatania, nawet jeśli inne parametry zmienią się w zakresie wartości.

  9. Prześlij potok.

Wyniki

Po zakończeniu szkolenia:

  • Aby zapisać migawkę wytrenowanego modelu, wybierz kartę Dane wyjściowe w prawym panelu składnika Trenowanie modelu . Wybierz ikonę Zarejestruj zestaw danych , aby zapisać model jako składnik wielokrotnego użytku.

  • Aby użyć modelu do oceniania, dodaj składnik Score Model (Generowanie wyników dla modelu ) do potoku.

Następne kroki

Zobacz zestaw składników dostępnych dla usługi Azure Machine Learning.