Dela via


Ordningstals regression

Viktigt

Stödet för Machine Learning Studio (klassisk) upphör den 31 augusti 2024. Vi rekommenderar att du byter till Azure Machine Learning innan dess.

Från och med den 1 december 2021 kan du inte längre skapa nya Machine Learning Studio-resurser (klassisk). Du kan fortsätta att använda befintliga Machine Learning Studio-resurser (klassisk) till och med den 31 augusti 2024.

Dokumentationen om ML Studio (klassisk) håller på att dras tillbaka och kanske inte uppdateras i framtiden.

Skapar en ordningstals regressionsmodell

Kategori: Machine Learning/initiera modell/regression

Anteckning

Gäller endast för: Machine Learning Studio (klassisk)

Liknande dra och släpp-moduler är tillgängliga i Azure Machine Learning designer.

Modulöversikt

I den här artikeln beskrivs hur du använder modulen ordningstals regression i Machine Learning Studio (klassisk) för att skapa en regressionsmodell som kan användas för att förutsäga rangordnade värden.

Några exempel på rangordnade värden:

  • Undersökningssvar som samlar in användarens önskade varumärken i skala 1 till 5
  • Ordningen på slutförarna i en ras
  • URL:er i rangordnade sökresultat

Mer om ordningstals regression

Ordningstals regression används när etiketten eller målkolumnen innehåller tal, men talen representerar en rangordning eller ordning i stället för ett numeriskt mått.

Att förutsäga ordningstal kräver en annan algoritm än att förutsäga värdena för tal i en kontinuerlig skala, eftersom de tal som tilldelas för att representera rangordningen inte har inbyggd skala.

Om du till exempel vill förutsäga elevernas testresultat använder du en standard regressionsmodell, eftersom elevernas testresultat varierar i kontinuerlig skala och kan mätas. Men för att förutsäga deras klassr rangordning måste du använda en ordningstals regressionsmodell.

Mer information om forskningen bakom den här algoritmen finns i det här dokumentet (nedladdningsbar PDF): https://papers.nips.cc/paper/3125-ordinal-regression-by-extended-binary-classification.pdf

Så här konfigurerar du ordningstals regression

Den här modulen löser ett rangordningsproblem som en serie relaterade klassificeringsproblem. Därför skapar algoritmen en serie utökade träningsexempel med hjälp av en binär modell för varje rangordning och tränar mot den utökade uppsättningen. Den här åtgärden kan vara beräkningsmässigt dyr.

  1. Lägg till modulen Ordinal Regression Model (Ordningstals regressionsmodell) i experimentet i Studio (klassisk). Du hittar den här modulen under Machine Learning - Initiera i kategorin Regression.

  2. Lägg till en modul som stöder binär klassificering och konfigurera modellen. Det finns flera moduler med två klasser i klassificeringskategorin .

  3. Anslut den binära klassificeringsmodellen som indata till modulen Ordinal Regression Model (Modell för ordningstals regression).

  4. Ytterligare parametrar krävs inte för ordningstals regressionsmodellen. algoritmen har förkonfigureras med de mest effektiva parametrarna för att lösa ett rangordningsproblem.

  5. Anslut en datauppsättning för träning och modulen Träna modell.

  6. I modulen Träna modell väljer du den kolumn som innehåller rangordningsvärdena.

    Rangordningsvärdena måste vara numeriska värden, men de behöver inte vara heltal eller positiva tal, så länge de representerar en sekvens.

    För bearbetning antas rangordningen ha ordningen 1 till K, där 1 är lägst rangordning och K är den högsta rangordningen. Modulen Träna modell kan dock fungera även om semantiken för din skala är omvänd.

    Om till exempel 1 i din ursprungliga undersökning var den högsta poängen och 5 är lägst påverkar det inte bearbetningen av modellen.

  7. Kör experimentet.

Resultat

När träningen är klar:

  • Om du vill göra förutsägelser ansluter du den tränade modellen tillsammans med nya data till modulen Poängmodell .

  • Om du vill utföra korsvalidering mot en etiketterad datauppsättning ansluter du den tränade modellen till korsvalideringsmodellen.

Exempel

Exempel på hur ordningstals regression används i maskininlärning finns i Azure AI Gallery.

  • Förebyggande underhåll – steg C: I det här exemplet används ordningstals regression för att rangordna värden som matas ut av en klassificeringsmodell, baserat på antagandet att värdet återspeglar allvarlighetsgraden för felklassificeringen.

Teknisk information

Algoritmen för ordningstals regression som används i den här eleven implementeras av utökad binär klassificering, enligt beskrivningen i dokumentet Ordinal Regression by Extended Binary Classification av Ling Li och Hsuan-Tien Lin, i NIPS 2006.

Begränsningar för indata

Du kan använda valfri numerisk kolumn som mål för en ordningstals regressionsmodell, men i praktiken bör du bara använda data som representerar någon typ av ordningsföljd eller rangordning.

Intervallen mellan rangordningarna antas vara okända och storleken på intervallet spelar ingen roll för modellen. Modellen förutsätter dock att rangordningsordningen följer den naturliga ordningen av tal.

Själva modellen tilldelar inte någon betydelse till en viss skala. Med andra ord kan du skapa en modell där 1 är en bra rankning och 10 är sämst, och i en annan modell förutsätter vi att 10 är den önskade rangordningen och 1 är sämst.

Rangordningsalgoritm

Träningsuppsättningen (X,Y) består av indatavektorer x och etiketter y. Etiketterna representerar rangordningar från 1 till k i följd: 1,2, ... , K. Rangordningen antas vara ordnad så att 1 är den lägsta eller sämsta rangordningen och K är den bästa eller högsta rangordningen.

Algoritmens crux ligger i att ändra de angivna indatafunktionerna X och etiketterna Y för att använda utökade exempel och sedan använda en binär klassificerare för att lösa ordningstals regressionsproblem. Den binära klassificeraren tränas för att ge ett ja/nej-svar på frågan "Är rangordningen större än r?"

För varje fall i träningsuppsättningen finns det till exempel utökade K-1-exempel och den högsta observerade rangordningen är K. De utökade funktionerna skapas genom att lägga till den första raden i en K-1 x K-1-identitetsmatris till indatafunktionerna för alla i. Etiketterna får +1 för de första r-1 raderna om dess rangordning är r och -1 till resten.

Exempelberäkningar

För att illustrera hur det fungerar, låt x1 vara den träningsfunktion vars rangordning är 3, där den högsta observerade rangordningen är 5. De utökade exempel som motsvarar den här funktionen är följande:

Ärende Testa Resulterande etikett
X11000 Är rangordning större än 1? Ja; därför +1
X10100 Är rangordningen större än 2? Ja; därför +1
X10010 Är rangordningen större än 3? Nej; därför ingen ytterligare funktion
X10001 Är rangordningen större än 4? Nej; därför ingen ytterligare funktion

Förväntade indata

Namn Typ Description
Ej tränad binär klassificeringsmodell ILearner-gränssnitt En otränad binär klassificeringsmodell

Utdata

Namn Typ Description
Ej tränad modell ILearner-gränssnitt En modell för otränad ordningstals regression

Se även

Regression