Sdílet prostřednictvím


Komponenta logistické regrese s více třídami

Tento článek popisuje komponentu v návrháři služby Azure Machine Learning.

Tato komponenta slouží k vytvoření logistického regresního modelu, který lze použít k predikci více hodnot.

Klasifikace pomocí logistické regrese je metoda učení pod dohledem, a proto vyžaduje označenou datovou sadu. Model vytrénujete tak, že jako vstup pro komponentu, jako je trénování modelu, zadáte model a datovou sadu označenou jako vstup. Vytrénovaný model se pak dá použít k predikci hodnot pro nové vstupní příklady.

Azure Machine Learning také poskytuje komponentu logistické regrese se dvěma třídami, která je vhodná pro klasifikaci binárních nebo dichotomických proměnných.

Informace o logistické regresi s více třídami

Logistická regrese je dobře známá metoda ve statistikách, která slouží k predikci pravděpodobnosti výsledku a je oblíbená pro klasifikační úlohy. Algoritmus předpovídá pravděpodobnost výskytu události přizpůsobením dat logistické funkci.

Ve vícetřídové logistické regresi lze klasifikátor použít k predikci více výsledků.

Konfigurace logistické regrese s více třídami

  1. Přidejte komponentu Logistická regrese s více třídami do kanálu.

  2. Určete, jak chcete model trénovat, nastavením možnosti Vytvořit režim trenéra.

    • Jeden parametr: Tuto možnost použijte, pokud víte, jak chcete model nakonfigurovat, a jako argumenty zadejte konkrétní sadu hodnot.

    • Rozsah parametrů: Tuto možnost vyberte, pokud si nejste jisti nejlepšími parametry a chcete spustit úklid parametrů. Vyberte rozsah hodnot, který chcete iterovat, a Hyperparametry modelu tunes iteruje přes všechny možné kombinace nastavení, která jste zadali k určení hyperparametrů, které vytvářejí optimální výsledky.

  3. Tolerance optimalizace, zadejte prahovou hodnotu pro konvergenci optimalizátoru. Pokud je zlepšení mezi iteracemi menší než prahová hodnota, algoritmus se zastaví a vrátí aktuální model.

  4. Hmotnost regularizace L1, hmotnost regularizace L2: Zadejte hodnotu, která se má použít pro parametry regularizace L1 a L2. Pro oba se doporučuje nenulová hodnota.

    Regularizace je metoda prevence přeurčení pomocí penalizace modelů s extrémními hodnotami koeficientu. Regularizace funguje tak, že k chybě hypotézy přidá penále, která je přidružená k hodnotám koeficientu. Přesný model s extrémními hodnotami koeficientů by byl penalizován více, ale méně přesný model s konzervativnějšími hodnotami by byl penalizován méně.

    Regularizace L1 a L2 mají různé účinky a použití. L1 lze použít u řídkých modelů, což je užitečné při práci s vysoce dimenzionálními daty. Naproti tomu regularizace L2 je vhodnější pro data, která nejsou řídká. Tento algoritmus podporuje lineární kombinaci hodnot regularizace L1 a L2: to znamená, pokud x = L1 a y = L2, ax + by = c definuje lineární rozsah regulárních termínů.

    Pro logistické regresní modely byly navrženy různé lineární kombinace termínů L1 a L2, jako je elastická net regularizace.

  5. Náhodné počáteční číslo: Pokud chcete, aby výsledky byly opakovatelné při spuštění, zadejte celočíselnou hodnotu, která se má použít jako počáteční hodnota algoritmu. Jinak se jako počáteční hodnota použije systémová hodnota hodin, která může vést k mírně odlišným výsledkům spuštění stejného kanálu.

  6. Připojte datovou sadu s popiskem a vytrénujte model:

    • Pokud nastavíte režim Vytvořit trenéra na Jeden parametr, připojte označenou datovou sadu a komponentu Train Model .

    • Pokud nastavíte režim Vytvořit trenéra na rozsah parametrů, připojte označenou datovou sadu a vytrénujte model pomocí hyperparametrů ladění modelu.

    Poznámka:

    Pokud do trénování modelu předáte rozsah parametrů, použije pouze výchozí hodnotu v seznamu parametrů.

    Pokud předáte jednu sadu hodnot parametrů komponentě Tune Model Hyperparameters , pokud očekává rozsah nastavení pro každý parametr, ignoruje hodnoty a použije výchozí hodnoty pro žáka.

    Pokud vyberete možnost Rozsah parametrů a zadáte jednu hodnotu pro libovolný parametr, použije se v rámci úklidu zadaná jedna hodnota, i když se v rozsahu hodnot změní jiné parametry.

  7. Odešlete kanál.

Další kroky

Podívejte se na sadu komponent dostupných pro Azure Machine Learning.