Ordinální regrese
Důležité
Podpora studia Machine Learning (Classic) skončí 31. srpna 2024. Doporučujeme do tohoto data přejít na službu Azure Machine Learning.
Od 1. prosince 2021 nebude možné vytvářet nové prostředky studia Machine Learning (Classic). Do 31. srpna 2024 můžete pokračovat v používání stávajících prostředků studia Machine Learning (Classic).
- přečtěte si informace o přesunu projektů strojového učení z ML Studio (classic) do Azure Machine Learning.
- přečtěte si další informace o Azure Machine Learning.
Dokumentace ke studiu ML (Classic) se vyřazuje z provozu a v budoucnu se nemusí aktualizovat.
Vytvoří ordinální regresní model.
kategorie: Machine Learning/inicializovat Model/regrese
Poznámka
platí pro: jenom Machine Learning Studio (classic)
podobné moduly přetažení jsou k dispozici v návrháři Azure Machine Learning.
Přehled modulu
tento článek popisuje, jak pomocí modulu ordinální regrese v Machine Learning studiu (classic) vytvořit regresní model, který se dá použít k předpovědi hodnot seřazených podle pořadí.
Některé příklady seřazených hodnot:
- Reakce na průzkum, které zachycují preferované značky uživatele na 1 až 5 škálování
- Pořadí dokončení v rámci rasy
- Adresy URL v seřazených výsledcích hledání
Další informace o ordinální regresi
Ordinální regrese se používá, když popisek nebo cílový sloupec obsahuje čísla, ale čísla reprezentují pořadí nebo pořadí místo číselného měření.
Předpovídání pořadových čísel vyžaduje jiný algoritmus než předpověď hodnot čísel v souvislém měřítku, protože čísla přiřazená k reprezentování pořadí řazení nemají vnitřní měřítko.
Například pro předpověď hodnocení testů studentů byste použili standardní regresní model, protože hodnocení testů studentů se liší od průběžného škálování a lze je měřit. Chcete-li však předpovědět jejich hodnocení tříd, je nutné použít ordinální regresní model.
Další informace o výzkumu za tímto algoritmem najdete v tomto dokumentu (ke stažení PDF): https://papers.nips.cc/paper/3125-ordinal-regression-by-extended-binary-classification.pdf
Jak nakonfigurovat ordinální regresi
Tento modul řeší problém hodnocení jako řadu souvisejících problémů s klasifikací. Proto algoritmus vytvoří řadu rozšířených příkladů cvičení s použitím binárního modelu pro každé pořadí a vlaky v této rozšířené sadě. Tato operace může být výpočetně náročná.
Přidejte modul ordinální regresní model do experimentu v studiu (Classic). tento modul můžete najít v části Machine Learning-Initializev kategorii regrese .
Přidejte modul, který podporuje binární klasifikaci, a nakonfigurujte model. Kategorie klasifikace obsahuje několik modulů se dvěma třídami.
Připojení binární klasifikační model jako vstup do modulu ordinální regrese model .
Další parametry nejsou požadovány pro ordinální regresní model; algoritmus byl předem nakonfigurován s nejefektivnějšími parametry pro řešení problému s hodnocením.
Připojení datovou sadu školení a modul vlakového modelu .
V modulu výuka modelu vyberte sloupec, který obsahuje hodnoty pořadí.
Hodnoty pořadí musí být číselné hodnoty, ale nemusí být celá čísla ani kladná čísla, pokud představují sekvenci.
Pro účely zpracování se předpokládá, že má pořadí 1 až K, kde 1 je nejnižší pořadí a K je nejvyšší pořadí. Modul vlakového modelu ale může fungovat i v případě, že se sémantika vašeho měřítka obrátí.
Například pokud jste v původním průzkumu, 1 bylo nejvyšší skóre a 5 je nejnižší, nemá vliv na zpracování modelu.
Spusťte experiment.
Výsledky
Po dokončení školení:
Pokud chcete předpovědi vytvořit, připojte k modulu určení skóre model školení společně s novými daty.
Chcete-li provést křížové ověřování u označených datových sad, připojte nevlakový model k modelu křížovéhoověřování.
Příklady
Příklady ordinální regrese ve službě Machine Learning najdete v Azure AI Gallery.
- Prediktivní údržba – krok C: v této ukázce se ordinální regrese používá k řazení výstupů hodnot podle klasifikačního modelu na předpokladu, že hodnota odráží závažnost klasifikace selhání.
Technické poznámky
Ordinální regresní algoritmus použitý v tomto seznámce je implementován pomocí rozšířené binární klasifikace, jak je popsáno v dokumentu s názvem ordinální regrese rozšířené binární klasifikací, podle Ling Li a Hsuan-Tien – v nips 2006.
Omezení vstupních dat
Můžete použít libovolný číselný sloupec jako cíl směrného regresního modelu, ale v praxi byste měli použít pouze data, která představují určitý řazení pořadí nebo řazení.
Předpokládá se, že intervaly mezi pořadím jsou neznámé a velikost tohoto intervalu nezáleží na modelu. model však předpokládá, že pořadí pořadí následuje za přirozeným řazením čísel.
Samotný model nepřiřazuje konkrétnímu měřítku žádný význam. Jinými slovy, můžete vytvořit jeden model, ve kterém 1 je dobrým rozměrem a 10 je nejhorší a v jiném modelu předpokládá, že 10 je požadovaným pořadím a 1 je nejhorší.
Algoritmus řazení
Sada školení (X, Y) obsahuje vstupní vektory X a Labels Y. Popisky představují pořadí od 1 do do v pořadí: 1, 2,... , K. Pořadí je považováno za řazené, což znamená, že 1 je nejnižší nebo nejhorší pořadí a K je nejlepší nebo nejvyšší pořadí.
Crux algoritmu spočívá v úpravách daných vstupních funkcí X a štítků Y pro použití rozšířených příkladů a následného použití binárního klasifikátoru k vyřešení problému ordinální regrese. V případě, že je v binárním třídění vyškolená odpověď na otázku, "je pořadí větší než r?"
Například pro každý případ v sadě školení existují k-1 rozšířené příklady a maximální zjištěný rozměr je K. Rozšířené funkce se vytvoří tak, že se připojí ke vstupním funkcím pro všechny i řádky matice stou i-1 × k-1. Popisky jsou uvedené + 1 pro první řádky r-1, pokud je pořadí r a-1 až do zbytku.
Ukázkové výpočty
Pro ilustraci, jak to funguje, nechte x1 funkci školení, jejíž pořadí je 3, kde maximální zjištěný rozměr je 5. Rozšířené příklady, které odpovídají této funkci, jsou následující:
Obchodní případ | Test | Výsledný popisek |
---|---|---|
X11000 | Je pořadí větší než 1? | Odpoví Proto + 1 |
X10100 | Je pořadí větší než 2? | Odpoví Proto + 1 |
X10010 | Je pořadí větší než 3? | Žádné Proto žádná další funkce |
X10001 | Je pořadí větší než 4? | Žádné Proto žádná další funkce |
Očekávané vstupy
Název | Typ | Description |
---|---|---|
Nevýukový model binární klasifikace | Rozhraní ILearner | Nevýukový binární klasifikační model |
Výstupy
Název | Typ | Description |
---|---|---|
Nevlakový model | Rozhraní ILearner | Nevlaková ordinální regresní model |