Sdílet prostřednictvím


Rozhodovací třída s více třídami

Důležité

Podpora studia Machine Learning (Classic) skončí 31. srpna 2024. Doporučujeme do tohoto data přejít na službu Azure Machine Learning.

Od 1. prosince 2021 nebude možné vytvářet nové prostředky studia Machine Learning (Classic). Do 31. srpna 2024 můžete pokračovat v používání stávajících prostředků studia Machine Learning (Classic).

Dokumentace ke studiu ML (Classic) se vyřazuje z provozu a v budoucnu se nemusí aktualizovat.

Vytvoří klasifikační model s více třídami pomocí algoritmu rozhodovacího algoritmu.

Kategorie: Machine Learning / Inicializovat model / klasifikaci

Poznámka

Platí pro: Machine Learning Studio (classic)

Podobné moduly s přetahováním jsou k dispozici v Azure Machine Learning návrháři.

Přehled modulu

Tento článek popisuje, jak pomocí modulu Multiclass Decision Můžete v Machine Learning Studiu (klasickém) vytvořit model strojového učení, který je založený na algoritmu strojového učení se supergrafem, který se označuje jako rozhodovací algoritmus.

Pomocí tohoto modulu definujete model a jeho parametry a pak připojíte trénovací datovou sadu s popisky pro trénování modelu pomocí jednoho z trénovacích modulů. Natrénovaný model lze použít k předpovídání cíle, který má více hodnot.

Další informace o rozhodovacích zařízeních

Rozhodovací struktury jsou nedávným rozšířením rozhodovacích doménových struktur. Rozhodovací seznam se skládá ze souboru acyklických grafů (DAG) směřované na rozhodování.

Rozhodnutí mají následující výhody:

  • Díky tomu, že se větve stromové struktury slučují, má rozhodovací dag obvykle nižší nároky na paměť a lepší výkon zobecnění než rozhodovací strom, i když za cenu o něco delší doby trénování.

  • Rozhodovací metody jsou neparametrické modely, které mohou představovat nelineární rozhodovací hranice.

  • Provádí integrovaný výběr a klasifikaci funkcí a jsou odolné v případě hlučných funkcí.

Další informace o výzkumu tohoto algoritmu strojového učení najdete v článku Rozhodovacíci: Kompaktní a bohaté modely pro klasifikaci (pdf ke stažení).

Jak nakonfigurovat model rozhodovacího modelu s více třídami

  1. Přidejte do experimentu v nástroji Studio (classic) modul Multiclass Decision Module. Tento modul najdete v části Machine Learning, inicializovat model aklasifikaci.

  2. Dvojím kliknutím na modul otevřete podokno Vlastnosti.

  3. Metoda převzorkování vyberte metodu pro vytvoření více stromů, a to buď bagging, nebo replikace.

    • Bagging (Označení): Tuto možnost vyberte, pokud chcete použít bagging (tzv. bootstrap aggregating).

      Každý strom v rozhodovací doménové struktuře jako výstup předpovídá Gaussova rozdělení. Agregací je najít Gaussova, jehož první dva okamžiky odpovídají momentům kombinace Gaussových kombinací všech Gaussianů vrácených jednotlivými stromy.

    • Replikovat: Tuto možnost vyberte, pokud chcete použít replikaci. V této metodě je každý strom natrénován na přesně stejných vstupních datech. Určení, který dělený predikát se používá pro každý uzel stromu, zůstává náhodné, takže se vytvoří různorodé stromy.

  4. Nastavením možnosti Vytvořit režim školitele určete, jak chcete model vytrénovat.

    • Jeden parametr: Tuto možnost použijte, pokud víte, jak chcete model nakonfigurovat.

    • Rozsah parametrů: Tuto možnost použijte, pokud si nejste jistí nejlepšími parametry a chcete použít úklid parametrů.

  5. Number of decision DAG (Počet rozhodovacích dag): Označuje maximální počet grafů, které je možné vytvořit ve směsi.

  6. Maximální hloubka rozhodovacích dag: Zadejte maximální hloubku každého grafu.

  7. Maximální šířka rozhodovacích dagů: Zadejte maximální šířku každého grafu.

  8. Počet kroků optimalizace na rozhodovací vrstvu DAG: Určete, kolik iterací dat se má provést při vytváření jednotlivých dag.

  9. Povolit neznámé hodnoty pro funkce kategorií: Tuto možnost vyberte, pokud chcete vytvořit skupinu pro neznámé hodnoty v testovacích nebo ověřovacích datech. Model může být pro známé hodnoty méně přesný, ale může poskytovat lepší předpovědi pro nové (neznámé) hodnoty.

    Pokud výběr této možnosti zrušíte, může model přijímat pouze hodnoty, které byly přítomny v trénovací data.

  10. Připojení datovou sadu s popiskem a jeden z školicích modulů:

    • Pokud nastavíte Vytvořit režim školitele na Jeden parametr, použijte modul Trénování modelu.

    • Pokud nastavíte Vytvořit režim školitelena Rozsah parametrů, použijte modul Tune Model Hyperparameters (Vyladit model hyperparametrů ). Při použití této možnosti algoritmus iteruje přes několik kombinací nastavení, která jste poskytli, a určuje kombinaci hodnot, které vytváří nejlepší model.

    Poznámka

    Pokud předáte rozsah parametrů do trénového modelu, použije se pouze první hodnota v seznamu rozsahů parametrů.

    Pokud modulu Vyladění modelu hyperparametrů předáte jednu sadu hodnot parametrů, bude modul, který očekává rozsah nastavení pro každý parametr, ignorovat tyto hodnoty a použije výchozí hodnoty pro toho, kdo se učí.

    Pokud vyberete možnost Rozsah parametrů a zadáte jednu hodnotu pro libovolný parametr, použije se tato jedna hodnota, kterou jste zadali v průběhu úklidu, i když se jiné parametry v rozsahu hodnot změní.

  11. Spusťte experiment.

Výsledky

Po dokončení trénování:

  • Pokud chcete použít model pro bodování, připojte ho ke score modelu, abyste předpověděli hodnoty pro nové vstupní příklady.

Příklady

Příklady použití rozhodovacích doménových struktur ve strojové učení najdete v Azure AI Gallery:

Technické poznámky

Tato část obsahuje podrobnosti o implementaci, tipy a odpovědi na nejčastější dotazy.

Další informace o procesu trénování s možností Replikovat najdete v těchto tématu:

Tipy k používání

Pokud máte omezená data nebo chcete minimalizovat čas strávený trénování modelu, vyzkoušejte tato doporučení:

Omezená trénovací sada

Pokud trénovací sada obsahuje omezený počet instancí:

  • Vytvoření rozhodovacího procesu pomocí velkého počtu rozhodovacích dagů (například více než 20)
  • K převzorkování použijte možnost Bagging .)
  • Zadejte velký počet kroků optimalizace na vrstvu DAG (například více než 10 000).

Omezená doba trénování

Pokud trénovací sada obsahuje velký počet instancí a doba trénování je omezená:

  • Vytvořte rozhodovací pravidlo, které používá menší počet rozhodovacích dagů (například 5–10).
  • Pro převzorkování použijte možnost Replikovat.
  • Zadejte menší počet kroků optimalizace na vrstvu DAG (například menší než 2000).

Parametry modulu

Name Rozsah Typ Výchozí Description
Metoda převzorkování Všechny Metoda převzorkování Pytlování Volba metody převzorkování
Počet dagů pro rozhodování >=1 Integer 8 Určení počtu rozhodovacích grafů, které lze vytvořit ve směsi
Maximální hloubka rozhodovacích dag >= 1 Integer 32 Zadejte maximální hloubku rozhodovacích grafů, které se mají v kompletu vytvořit.
Maximální šířka DAG rozhodnutí >= 8 Integer 128 Zadejte maximální šířku grafů rozhodnutí, které se mají v kompletu vytvořit.
Počet kroků optimalizace na DAG vrstvu na rozhodnutí >= 1000 Integer 2 048 Zadejte počet kroků, které se mají použít k optimalizaci jednotlivých úrovní grafů rozhodnutí.
Povolení neznámých hodnot pro funkce kategorií Všechny Logická hodnota Ano Určuje, jestli je možné namapovat neznámé hodnoty existujících funkcí kategorií na novou, další funkci.

Výstupy

Název Typ Description
Nevlakový model Rozhraní ILearner Nevlakový model klasifikace s více třídami

Viz také

Rozhodnutí Jungle se dvěma třídami
Classification
Seznam modulů a-Z