Sdílet prostřednictvím


Ordinální regrese

Důležité

Podpora studia Machine Learning (Classic) skončí 31. srpna 2024. Doporučujeme do tohoto data přejít na službu Azure Machine Learning.

Od 1. prosince 2021 nebude možné vytvářet nové prostředky studia Machine Learning (Classic). Do 31. srpna 2024 můžete pokračovat v používání stávajících prostředků studia Machine Learning (Classic).

Dokumentace ke studiu ML (Classic) se vyřazuje z provozu a v budoucnu se nemusí aktualizovat.

Vytvoří ordinální regresní model.

kategorie: Machine Learning/inicializovat Model/regrese

Poznámka

platí pro: jenom Machine Learning Studio (classic)

podobné moduly přetažení jsou k dispozici v návrháři Azure Machine Learning.

Přehled modulu

tento článek popisuje, jak pomocí modulu ordinální regrese v Machine Learning studiu (classic) vytvořit regresní model, který se dá použít k předpovědi hodnot seřazených podle pořadí.

Některé příklady seřazených hodnot:

  • Reakce na průzkum, které zachycují preferované značky uživatele na 1 až 5 škálování
  • Pořadí dokončení v rámci rasy
  • Adresy URL v seřazených výsledcích hledání

Další informace o ordinální regresi

Ordinální regrese se používá, když popisek nebo cílový sloupec obsahuje čísla, ale čísla reprezentují pořadí nebo pořadí místo číselného měření.

Předpovídání pořadových čísel vyžaduje jiný algoritmus než předpověď hodnot čísel v souvislém měřítku, protože čísla přiřazená k reprezentování pořadí řazení nemají vnitřní měřítko.

Například pro předpověď hodnocení testů studentů byste použili standardní regresní model, protože hodnocení testů studentů se liší od průběžného škálování a lze je měřit. Chcete-li však předpovědět jejich hodnocení tříd, je nutné použít ordinální regresní model.

Další informace o výzkumu za tímto algoritmem najdete v tomto dokumentu (ke stažení PDF): https://papers.nips.cc/paper/3125-ordinal-regression-by-extended-binary-classification.pdf

Jak nakonfigurovat ordinální regresi

Tento modul řeší problém hodnocení jako řadu souvisejících problémů s klasifikací. Proto algoritmus vytvoří řadu rozšířených příkladů cvičení s použitím binárního modelu pro každé pořadí a vlaky v této rozšířené sadě. Tato operace může být výpočetně náročná.

  1. Přidejte modul ordinální regresní model do experimentu v studiu (Classic). tento modul můžete najít v části Machine Learning-Initializev kategorii regrese .

  2. Přidejte modul, který podporuje binární klasifikaci, a nakonfigurujte model. Kategorie klasifikace obsahuje několik modulů se dvěma třídami.

  3. Připojení binární klasifikační model jako vstup do modulu ordinální regrese model .

  4. Další parametry nejsou požadovány pro ordinální regresní model; algoritmus byl předem nakonfigurován s nejefektivnějšími parametry pro řešení problému s hodnocením.

  5. Připojení datovou sadu školení a modul vlakového modelu .

  6. V modulu výuka modelu vyberte sloupec, který obsahuje hodnoty pořadí.

    Hodnoty pořadí musí být číselné hodnoty, ale nemusí být celá čísla ani kladná čísla, pokud představují sekvenci.

    Pro účely zpracování se předpokládá, že má pořadí 1 až K, kde 1 je nejnižší pořadí a K je nejvyšší pořadí. Modul vlakového modelu ale může fungovat i v případě, že se sémantika vašeho měřítka obrátí.

    Například pokud jste v původním průzkumu, 1 bylo nejvyšší skóre a 5 je nejnižší, nemá vliv na zpracování modelu.

  7. Spusťte experiment.

Výsledky

Po dokončení školení:

  • Pokud chcete předpovědi vytvořit, připojte k modulu určení skóre model školení společně s novými daty.

  • Chcete-li provést křížové ověřování u označených datových sad, připojte nevlakový model k modelu křížovéhoověřování.

Příklady

Příklady ordinální regrese ve službě Machine Learning najdete v Azure AI Gallery.

  • Prediktivní údržba – krok C: v této ukázce se ordinální regrese používá k řazení výstupů hodnot podle klasifikačního modelu na předpokladu, že hodnota odráží závažnost klasifikace selhání.

Technické poznámky

Ordinální regresní algoritmus použitý v tomto seznámce je implementován pomocí rozšířené binární klasifikace, jak je popsáno v dokumentu s názvem ordinální regrese rozšířené binární klasifikací, podle Ling Li a Hsuan-Tien – v nips 2006.

Omezení vstupních dat

Můžete použít libovolný číselný sloupec jako cíl směrného regresního modelu, ale v praxi byste měli použít pouze data, která představují určitý řazení pořadí nebo řazení.

Předpokládá se, že intervaly mezi pořadím jsou neznámé a velikost tohoto intervalu nezáleží na modelu. model však předpokládá, že pořadí pořadí následuje za přirozeným řazením čísel.

Samotný model nepřiřazuje konkrétnímu měřítku žádný význam. Jinými slovy, můžete vytvořit jeden model, ve kterém 1 je dobrým rozměrem a 10 je nejhorší a v jiném modelu předpokládá, že 10 je požadovaným pořadím a 1 je nejhorší.

Algoritmus řazení

Sada školení (X, Y) obsahuje vstupní vektory X a Labels Y. Popisky představují pořadí od 1 do do v pořadí: 1, 2,... , K. Pořadí je považováno za řazené, což znamená, že 1 je nejnižší nebo nejhorší pořadí a K je nejlepší nebo nejvyšší pořadí.

Crux algoritmu spočívá v úpravách daných vstupních funkcí X a štítků Y pro použití rozšířených příkladů a následného použití binárního klasifikátoru k vyřešení problému ordinální regrese. V případě, že je v binárním třídění vyškolená odpověď na otázku, "je pořadí větší než r?"

Například pro každý případ v sadě školení existují k-1 rozšířené příklady a maximální zjištěný rozměr je K. Rozšířené funkce se vytvoří tak, že se připojí ke vstupním funkcím pro všechny i řádky matice stou i-1 × k-1. Popisky jsou uvedené + 1 pro první řádky r-1, pokud je pořadí r a-1 až do zbytku.

Ukázkové výpočty

Pro ilustraci, jak to funguje, nechte x1 funkci školení, jejíž pořadí je 3, kde maximální zjištěný rozměr je 5. Rozšířené příklady, které odpovídají této funkci, jsou následující:

Obchodní případ Test Výsledný popisek
X11000 Je pořadí větší než 1? Odpoví Proto + 1
X10100 Je pořadí větší než 2? Odpoví Proto + 1
X10010 Je pořadí větší než 3? Žádné Proto žádná další funkce
X10001 Je pořadí větší než 4? Žádné Proto žádná další funkce

Očekávané vstupy

Název Typ Description
Nevýukový model binární klasifikace Rozhraní ILearner Nevýukový binární klasifikační model

Výstupy

Název Typ Description
Nevlakový model Rozhraní ILearner Nevlaková ordinální regresní model

Viz také

Regrese