Two-Class Decision Zamów
Ważne
Obsługa programu Machine Learning Studio (wersja klasyczna) zakończy się 31 sierpnia 2024 r. Zalecamy przejście do usługi Azure Machine Learning przed tym terminem.
Od 1 grudnia 2021 r. nie będzie można tworzyć nowych zasobów programu Machine Learning Studio (wersja klasyczna). Do 31 sierpnia 2024 r. można będzie nadal korzystać z istniejących zasobów programu Machine Learning Studio (wersja klasyczna).
- Zobacz informacje na temat przenoszenia projektów uczenia maszynowego z programu ML Studio (wersja klasyczna) do Azure Machine Learning.
- Dowiedz się więcej o Azure Machine Learning.
Dokumentacja programu ML Studio (wersja klasyczna) jest wycofywana i może nie być aktualizowana w przyszłości.
Tworzy dwuklasowy model klasyfikacji przy użyciu algorytmu algorytmu podejmowania decyzji
Kategoria: Machine Learning/ Inicjowanie modelu/klasyfikacji
Uwaga
Dotyczy: tylko Machine Learning Studio (klasyczne)
Podobne moduły przeciągania i upuszczania są dostępne w Azure Machine Learning projektanta.
Omówienie modułu
W tym artykule opisano, jak za pomocą modułu Two-Class Decision Model w programie Machine Learning Studio (wersja klasyczna) utworzyć model uczenia maszynowego oparty na nadzorowym algorytmie uczenia zespołowego nazywanym algorytmami podejmowania decyzji.
Moduł Two-Class Decision Gdy zwraca nieprzeszkolony klasyfikator. Następnie trenuje się ten model na podstawie zestawu danych treningowych z etykietami przy użyciuhiperparametrów trenowania modelu lub dostrajania modelu. Wytrenowany model może być następnie używany do przewidywania.
Więcej informacji o procesach decyzyjnych
Lasy decyzyjne to niedawne rozszerzenie lasów decyzyjnych. Proces decyzyjny składa się z grupy grafów acyklicznych (DAG, decision directed acyclic graph).
Decyzje mają następujące zalety:
Zezwalając gałęziom drzewa na scalanie, decyzje dag zwykle mają mniejszy rozmiar pamięci i lepszą wydajność uogólniania niż drzewo decyzyjne, chociaż kosztem nieco dłuższego czasu trenowania.
Przedsiębiorstwa decyzyjne są modelami nieparametrycznymi, które mogą reprezentować nieliniowe granice decyzyjne.
Wykonują one zintegrowane operacje wyboru i klasyfikacji funkcji oraz są odporne w obecności hałaśliwych funkcji.
Porada
Aby uzyskać więcej informacji na temat badań na podstawie tego algorytmu uczenia maszynowego, zobacz Decision Systems: Compact and Rich Models for Classification (Modele decyzji: kompaktowanie i rozbudowane modele klasyfikacji) (plik PDF do pobrania).
Jak skonfigurować Two-Class Decision Zadomów
Dodaj moduł Two-Class Decision Module ( Dwuklasowe decyzje) do eksperymentu w programie Studio (wersja klasyczna).
W przypadku metody Próbkowanie wybierz metodę używaną do tworzenia poszczególnych drzew. Możesz wybrać opcję Bagging (Bagging) lub Replicate (Replikuj).
Bagging (Bagging): wybierz tę opcję, aby użyć funkcji bagging, nazywanej również agregowaniem bootstrap.
Każde drzewo w procesie decyzyjnym wyprowadza rozkład gaussański jako przewidywanie. Agregacja to znalezienie Gaussona, którego pierwsze dwa momenty pasują do momentów kombinacji gaussów podanych przez połączenie wszystkich gaussów zwracanych przez poszczególne drzewa.
Replikacja: w replikacji każde drzewo jest trenowane na dokładnie tych samych danych wejściowych. Określenie, który predykat podzielony jest używany dla każdego węzła drzewa, pozostaje losowe, a drzewa będą zróżnicowane.
Aby uzyskać więcej informacji, zobacz Decision Forests for przetwarzanie obrazów and Medical Image Analysis (Lasy decyzyjne dla przetwarzanie obrazów medycznej analizy obrazów). Crimiowanoi i J. Shotton. Springer 2013.
Określ sposób trenowania modelu, ustawiając opcję Utwórz tryb szkoleniowy .
Pojedynczy parametr: jeśli wiesz, jak chcesz skonfigurować model, możesz podać określony zestaw wartości jako argumenty.
Zakres parametrów: jeśli nie masz pewności co do najlepszych parametrów, możesz znaleźć optymalne parametry, określając wiele wartości i używając modułu Hiperparametry modelu dostrajania, aby znaleźć optymalną konfigurację. Instruktor będzie iterować po wielu kombinacjach podanych ustawień i określa kombinację wartości, która tworzy najlepszy model.
W przypadku wartości Liczba dag decyzyjnych wskaż maksymalną liczbę grafów, które można utworzyć w zespole.
W przypadku maksymalnej głębokości poszczególnych grafów należy wskazać maksymalną głębokość poszczególnych grafów.
W przypadku wartości Maksymalna szerokość poszczególnych grafów DAG dla decyzji wskaż maksymalną szerokość poszczególnych grafów.
W części Liczba kroków optymalizacji na warstwę daG decyzji wskaż liczbę iteracji danych do wykonania podczas tworzenia poszczególnych procesów DAG.
Wybierz opcję Zezwalaj na nieznane wartości dla funkcji kategorii, aby utworzyć grupę dla nieznanych wartości w danych testowania lub walidacji.
Jeśli ją odznaczysz, model może akceptować tylko wartości zawarte w danych szkoleniowych. W pierwszym przypadku model może być mniej dokładny dla znanych wartości, ale może zapewnić lepsze przewidywania dla nowych (nieznanych) wartości.
Dodaj otagowany zestaw danych do eksperymentu i połącz jeden z modułów szkoleniowych.
Jeśli ustawisz tryb Tworzenia instruktora na wartość Pojedynczy parametr, użyj modułu Train Model (Trenowanie modelu).
Jeśli ustawisz ustawienie Utwórz tryb instruktora na wartość Zakres parametrów, użyj modułu Hiperparametry modelu dostrajania .
Uwaga
Jeśli przekażemy zakres parametrów do funkcji Train Model, będzie używana tylko pierwsza wartość z listy zakresów parametrów.
Jeśli przekażemy pojedynczy zestaw wartości parametrów do modułu Hiperparametry modelu dostrajania, jeśli oczekuje on zakresu ustawień dla każdego parametru, zignoruje wartości i użyje wartości domyślnych dla uczących się.
W przypadku wybrania opcji Zakres parametrów i wprowadzenia pojedynczej wartości dla dowolnego parametru określona pojedyncza wartość będzie używana podczas całej czyszczenie, nawet jeśli inne parametry zmienią się w zakresie wartości.
Wyniki
Po zakończeniu szkolenia:
- Aby użyć modelu do oceniania, połącz go z modelem Score Model (Ocena modelu) w celu przewidywania wartości dla nowych przykładów wejściowych.
Przykłady
Przykłady sposobu, w jaki decyzje są używane w uczeniu maszynowym, można znaleźć w Azure AI Gallery:
- Porównanie klasyfikatorów binarnych: używa kilku algorytmów i omawia ich zalety i wady.
Uwagi techniczne
Ta sekcja zawiera szczegóły implementacji, porady i odpowiedzi na często zadawane pytania.
Porady dotyczące użycia
Jeśli masz ograniczone dane lub chcesz zminimalizować czas trenowania modelu, wypróbuj te ustawienia.
Ograniczony zestaw treningowy
Jeśli zestaw treningowy jest mały:
- Utwórz decyzje przy użyciu dużej liczby decyzyjnych grupy DAG (na przykład ponad 20).
- Użyj opcji Bagging w celu ponownego próbkowania.
- Określ dużą liczbę kroków optymalizacji na warstwę DAG (na przykład ponad 10 000).
Ograniczony czas trenowania
Jeśli zestaw treningowy jest duży, ale czas trenowania jest ograniczony:
- Utwórz decyzje przy użyciu mniejszej liczby grupy DAG decyzji (na przykład 5–10).
- Użyj opcji Replikuj do ponownego próbkowania.
- Określ mniejszą liczbę kroków optymalizacji na warstwę DAG (na przykład mniejszą niż 2000).
Parametry modułu
Nazwa | Zakres | Typ | Domyślny | Opis |
---|---|---|---|---|
Metoda ponownego próbkowania | Dowolne | ResamplingMethod | Pakowania | Wybieranie metody ponownego próbkowania |
Liczba decyzje DAG | >= 1 | Liczba całkowita | 8 | Określ liczbę wykresów decyzyjnych do skompilowania w zespole |
Maksymalna głębokość decyzyjnych dag | >= 1 | Liczba całkowita | 32 | Określ maksymalną głębokość wykresów decyzyjnych w zespole |
Maksymalna szerokość decyzje dag | >= 8 | Liczba całkowita | 128 | Określanie maksymalnej szerokości wykresów decyzyjnych w zespole |
Liczba kroków optymalizacji na warstwę dag decyzji | >= 1000 | Liczba całkowita | 2048 | Określ liczbę kroków, które należy wykonać, aby zoptymalizować każdy poziom wykresów decyzyjnych |
Zezwalaj na nieznane wartości dla cech kategorii | Dowolne | Boolean | Prawda | Wskazanie, czy nieznane wartości istniejących cech kategorii mogą być mapowane na nową, dodatkową funkcję |
Dane wyjściowe
Nazwa | Typ | Opis |
---|---|---|
Nie wytrenowany model | ILearner, interfejs | Nieprzeszkolony binarny model klasyfikacji |