Two-Class Bayes Point Machine

Artikel
03/05/2020

Viktigt

Stödet för Machine Learning Studio (klassisk) upphör den 31 augusti 2024. Vi rekommenderar att du byter till Azure Machine Learning innan dess.

Från och med den 1 december 2021 kan du inte längre skapa nya Machine Learning Studio-resurser (klassisk). Du kan fortsätta att använda befintliga Machine Learning Studio-resurser (klassisk) till och med den 31 augusti 2024.

Dokumentationen om ML Studio (klassisk) håller på att dras tillbaka och kanske inte uppdateras i framtiden.

Skapar en binär klassificeringsmodell för Bayes-punktdator

Kategori: Machine Learning/initiera modell/klassificering

Anteckning

Gäller endast för: Machine Learning Studio (klassisk)

Liknande dra och släpp-moduler är tillgängliga i Azure Machine Learning designer.

Modulöversikt

I den här artikeln beskrivs hur du använder modulen Two-Class Bayes Point Machine i Machine Learning Studio (klassisk) för att skapa en otränad binär klassificeringsmodell.

Algoritmen i den här modulen använder en bayesiansk metod för linjär klassificering som kallas "Bayes Point Machine". Den här algoritmen approximerar effektivt det teoretiskt optimala Bayesianska medelvärdet av linjära klassificerare (vad gäller generaliseringsprestanda) genom att välja en "genomsnittlig" klassificerare, Bayes Point. Eftersom Bayes Point Machine är en Bayesiansk klassificeringsmodell är den inte känslig för överanpassad till träningsdata.

Mer information finns i Chris Probabilistic Inferences inlägg på Microsoft Machine Learning blog: Embracing Uncertainty - Probabilistic Inference.

Så här konfigurerar du Two-Class Bayes Point Machine

I Machine Learning Studio (klassisk) lägger du till modulen Two-Class Bayes Point Machine i experimentet. Du hittar modulen under Machine Learning,Initiera modell, Klassificering.
I Antal tränings-iterationer anger du ett tal för att ange hur ofta algoritmen för meddelande passerar itererar över träningsdata. Vanligtvis ska antalet iterationer anges till ett värde i intervallet 5–100.

Ju fler tränings-iterationer, desto mer exakta förutsägelser. Träningen går dock långsammare.

För de flesta datauppsättningar räcker standardinställningen med 30 tränings-iterationer för att algoritmen ska kunna göra korrekta förutsägelser. Ibland kan korrekta förutsägelser göras med färre iterationer. För datauppsättningar med starkt korrelerade funktioner kan du dra nytta av fler tränings-iterationer.
Välj alternativet Inkludera bias om du vill att en konstant funktion eller bias ska läggas till i varje instans i träning och förutsägelse.

Det är nödvändigt att inkludera en bias när data inte redan innehåller en konstant funktion.
Välj alternativet Tillåt okända värden i kategoriska funktioner för att skapa en grupp för okända värden.

Om du avmarkerar det här alternativet kan modellen bara acceptera de värden som finns i träningsdata.

Om du väljer det här alternativet och tillåter okända värden kan modellen vara mindre exakt för kända värden, men den kan ge bättre förutsägelser för nya (okända) värden.
Lägg till en instans av modulen Träna modell och dina träningsdata.
Anslut träningsdata och utdata från modulen Two-Class Bayes Point Machine till modulen Train Model (Träna modell) och välj etikettkolumnen.
Kör experimentet.

Resultat

När träningen är klar högerklickar du på utdata för modulen Train Model ( Träna modell) för att visa resultatet:

Om du vill se en sammanfattning av modellens parametrar, tillsammans med de funktionsvikter som du lärt dig under träningen, väljer du Visualisera.
Om du vill spara modellen för senare användning högerklickar du på utdata för Train MOdel (Träna MOdel) och väljer Save as Trained Model (Spara som tränad modell).
Om du vill göra förutsägelser använder du den tränade modellen som indata till modulen Poängmodell .

Den tränade modellen kan också skickas till korsvalideringsmodellen för korsvalidering mot en etiketterad datauppsättning.

Exempel

Information om hur Two-Class Bayes Point Machine används i maskininlärning finns i följande exempelexperiment i Azure AI Gallery:

Jämför binära klassificerare: Det här exemplet visar användningen av flera klassificerare med två klasser.

Teknisk information

Det här avsnittet innehåller implementeringsinformation och vanliga frågor och svar om den här algoritmen.

Information från den ursprungliga forskningen och den underliggande teorin finns i det här dokumentet (PDF): Bayes Point Machines, av Herbert, Graepe och Camp

Den här implementeringen förbättrar dock den ursprungliga algoritmen på flera sätt:

Den använder algoritmen för förväntningsspridning av meddelanden. Mer information finns i A family of algorithms for approximate Bayesian inference (En familj med algoritmer för ungefärlig Bayesiansk slutsatsledning).
En parametersökning krävs inte.
Den här metoden kräver inte att data normaliseras.

Dessa förbättringar gör klassificeringsmodellen för Bayes Point Machine mer robust och enklare att använda, och du kan kringgå det tidskrävande steget för parameterjustering.

Modulparametrar

Name	Intervall	Typ	Standardvärde	Description
Antal tränings iterationer	>= 1	Integer	30	Ange antalet iterationer som ska användas vid träning
Inkludera bias	Valfri	Boolesk	Sant	Ange om en konstant funktion eller bias ska läggas till i varje instans
Tillåt okända värden i kategoriska funktioner	Valfri	Boolesk	Sant	Om det är Sant skapas ytterligare en nivå för varje kategorisk kolumn. Alla nivåer i testdatamängden som inte är tillgängliga i träningsdatamängden mappas till den här ytterligare nivån.

Utdata

Namn	Typ	Description
Ej tränad modell	ILearner-gränssnitt	En otränad binär klassificeringsmodell

Se även

ClassificationA-Z-modullista

Dela via