Sdílet prostřednictvím


Posílený rozhodovací strom s několika třídami

Tento článek popisuje komponentu v návrháři služby Azure Machine Learning.

Tato komponenta slouží k vytvoření modelu strojového učení založeného na algoritmu posílených rozhodovacích stromů.

Posílený rozhodovací strom je metoda učení souboru, ve které druhý strom opravuje chyby prvního stromu, třetí strom opravuje chyby prvního a druhého stromu atd. Předpovědi jsou založeny na souboru stromů společně.

Způsob konfigurace

Tato komponenta vytvoří trénovaný klasifikační model. Protože klasifikace je metoda učení pod dohledem, potřebujete datovou sadu s popiskem, která obsahuje sloupec popisku s hodnotou pro všechny řádky.

Tento typ modelu můžete vytrénovat pomocí modelu trénování.

  1. Přidejte do kanálu komponentu Multiclass Boosted Decision Tree .

  2. Určete, jak má být model trénován nastavením možnosti Vytvořit režim trenéra.

    • Jeden parametr: Pokud víte, jak chcete model nakonfigurovat, můžete jako argumenty zadat konkrétní sadu hodnot.

    • Rozsah parametrů: Tuto možnost vyberte, pokud si nejste jisti nejlepšími parametry a chcete spustit úklid parametrů. Vyberte rozsah hodnot, který chcete iterovat, a Hyperparametry modelu tunes iteruje přes všechny možné kombinace nastavení, která jste zadali k určení hyperparametrů, které vytvářejí optimální výsledky.

  3. Maximální počet listů na strom omezuje maximální počet uzlů terminálu (listů), které je možné vytvořit v libovolném stromu.

    Zvýšením této hodnoty potenciálně zvětšíte velikost stromu a dosáhnete vyšší přesnosti, a to v případě přeurčení a delšího trénování.

  4. Minimální počet vzorků na uzel typu list označuje počet případů potřebných k vytvoření libovolného koncového uzlu (list) ve stromu.

    Zvýšením této hodnoty zvýšíte prahovou hodnotu pro vytváření nových pravidel. Například s výchozí hodnotou 1 může vytvoření nového pravidla způsobit i jeden případ. Pokud zvýšíte hodnotu na 5, trénovací data by musela obsahovat alespoň pět případů, které splňují stejné podmínky.

  5. Rychlost učení definuje velikost kroku při učení. Zadejte číslo od 0 do 1.

    Rychlost učení určuje, jak rychle nebo pomalu se učení konverguje na optimálním řešení. Pokud je velikost kroku příliš velká, můžete optimální řešení překroutit. Pokud je velikost kroku příliš malá, trénování trvá déle, než se shodí s nejlepším řešením.

  6. Počet vytvořených stromů označuje celkový počet rozhodovacích stromů, které se mají vytvořit v souboru. Vytvořením více rozhodovacích stromů můžete potenciálně získat lepší pokrytí, ale doba trénování se zvýší.

  7. Náhodné počáteční číslo volitelně nastaví nezáporné celé číslo, které se použije jako náhodná počáteční hodnota. Určení počáteční hodnoty zajišťuje reprodukovatelnost napříč běhy, která mají stejná data a parametry.

    Náhodné počáteční hodnoty jsou standardně nastaveny na hodnotu 42. Po sobě jdoucí běhy používající různá náhodná semena mohou mít různé výsledky.

  8. Trénování modelu:

    • Pokud nastavíte režim Vytvořit trenéra na Jeden parametr, připojte označenou datovou sadu a komponentu Train Model .

    • Pokud nastavíte režim Vytvořit trenéra na rozsah parametrů, připojte označenou datovou sadu a vytrénujte model pomocí hyperparametrů ladění modelu.

    Poznámka:

    Pokud do trénování modelu předáte rozsah parametrů, použije pouze výchozí hodnotu v seznamu parametrů.

    Pokud předáte jednu sadu hodnot parametrů komponentě Tune Model Hyperparameters , pokud očekává rozsah nastavení pro každý parametr, ignoruje hodnoty a použije výchozí hodnoty pro žáka.

    Pokud vyberete možnost Rozsah parametrů a zadáte jednu hodnotu pro libovolný parametr, použije se v rámci úklidu zadaná jedna hodnota, i když se v rozsahu hodnot změní jiné parametry.

Další kroky

Podívejte se na sadu komponent dostupných pro Azure Machine Learning.