Two-Class Bayes Point Machine

Artikel
03/05/2020

Belangrijk

De ondersteuning voor Azure Machine Learning-studio (klassiek) eindigt op 31 augustus 2024. U wordt aangeraden om vóór die datum over te stappen naar Azure Machine Learning.

Vanaf 1 december 2021 kunt u geen nieuwe resources voor Azure Machine Learning-studio (klassiek) meer maken. Tot en met 31 augustus 2024 kunt u de bestaande resources van Azure Machine Learning-studio (klassiek) blijven gebruiken.

Zie informatie over het verplaatsen machine learning van ML Studio (klassiek) naar Azure Machine Learning.
Meer informatie over Azure Machine Learning.

De documentatie van ML-studio (klassiek) wordt buiten gebruik gesteld en wordt in de toekomst mogelijk niet meer bijgewerkt.

Hiermee maakt u een binair classificatiemodel voor bayes-machines

Categorie: Machine Learning/ Model/classificatie initialiseren

Notitie

Van toepassing op: Machine Learning Studio (klassiek)

Vergelijkbare modules voor slepen en neerzetten zijn beschikbaar in Azure Machine Learning designer.

Moduleoverzicht

In dit artikel wordt beschreven hoe u de module Two-Class Bayes Point Machine in Machine Learning Studio (klassiek) gebruikt om een ongetraind binair classificatiemodel te maken.

Het algoritme in deze module maakt gebruik van een Bayesiaanse benadering van lineaire classificatie, de 'Bayes Point Machine'. Dit algoritme benadert efficiënt het theoretisch optimale Bayesiaanse gemiddelde van lineaire classificaties (in termen van generalisatieprestaties) door één 'gemiddelde' classificatie te kiezen, de Bayes Point. Omdat de Bayes Point-machine een Bayesisch classificatiemodel is, is deze niet gevoelig voor overfitting voor de trainingsgegevens.

Zie het bericht van Chris Machine Learning blog: Embracing Uncertainty - Probabilistic Inference (Blog van Microsoft Machine Learning: Embracing Uncertainty - Probabilistic Inference) voor meer informatie.

Een Bayes PointTwo-Class machine configureren

Voeg Machine Learning Bayes Point Machine-module met twee klassen toe aan uw experiment in Machine Learning Studio (klassiek). U vindt de module onder Machine Learning, Model initialiseren, Classificatie.
Bij Aantal trainings iteraties typt u een getal om op te geven hoe vaak het message-passing algoritme de trainingsgegevens door itereert. Normaal gesproken moet het aantal iteraties worden ingesteld op een waarde in het bereik 5 – 100.

Hoe hoger het aantal trainings iteraties, hoe nauwkeuriger de voorspellingen; De training verloopt echter langzamer.

Voor de meeste gegevenssets is de standaardinstelling van 30 trainings iteraties voldoende voor het algoritme om nauwkeurige voorspellingen te doen. Soms kunnen nauwkeurige voorspellingen worden gedaan met minder iteraties. Voor gegevenssets met sterk gecorreleerde functies kunt u profiteren van meer trainings iteraties.
Selecteer de optie Vooroordelen opnemen als u een constante functie of bias wilt toevoegen aan elke instantie in training en voorspelling.

Het is noodzakelijk om een bias op te nemen wanneer de gegevens nog geen constante functie bevatten.
Selecteer de optie Onbekende waarden toestaan in categorische functies om een groep voor onbekende waarden te maken.

Als u deze optie uitselecteert, kan het model alleen de waarden accepteren die zijn opgenomen in de trainingsgegevens.

Als u deze optie selecteert en onbekende waarden toestaat, is het model mogelijk minder nauwkeurig voor bekende waarden, maar kan het betere voorspellingen geven voor nieuwe (onbekende) waarden.
Voeg een exemplaar van de module Train Model en uw trainingsgegevens toe.
Verbinding maken trainingsgegevens en de uitvoer van de module Bayes Point Machine met twee klassen door aan de module Train Model en kies de labelkolom.
Voer het experiment uit.

Resultaten

Nadat de training is voltooid, klikt u met de rechtermuisknop op de uitvoer van de module Train Model om de resultaten weer te geven:

Selecteer Visualize (Visualiseren) voor een overzicht van de parameters van het model, samen met de functiegewichten die tijdens de training zijn geleerd.
Als u het model wilt opslaan voor later gebruik, klikt u met de rechtermuisknop op de uitvoer van MOdel trainen en selecteert u Opslaan als getraind model.
Als u voorspellingen wilt doen, gebruikt u het getrainde model als invoer voor de module Score Model .

Het ongetrainde model kan ook worden doorgegeven aan het model voor kruisvalidatie voor kruisvalidatie op een gelabelde gegevensset.

Voorbeelden

Als u wilt zien hoe Two-Class Bayes Point Machine wordt gebruikt in machine learning, bekijkt u deze voorbeeldexperimenten in Azure AI Gallery:

Binaire classificaties vergelijken: in dit voorbeeld wordt het gebruik van meerdere classificaties met twee klassen gedemonstreerd.

Technische opmerkingen

Deze sectie bevat implementatiedetails en veelgestelde vragen over dit algoritme.

Details van het oorspronkelijke onderzoek en de onderliggende theorie zijn beschikbaar in dit document (PDF): Bayes Point Machines, door Pdf, door Graepe en

Deze implementatie verbetert echter op verschillende manieren het oorspronkelijke algoritme:

Het maakt gebruik van het algoritme voor het doorgeven van berichten naar verwachting. Zie A family of algorithms for approximate Bayesian inference (Een familie van algoritmen voor geschatte Bayesiaanse deferentie) voor meer informatie.
Een parameter-opruiming is niet vereist.
Voor deze methode is niet vereist dat gegevens worden genormaliseerd.

Deze verbeteringen zorgen ervoor dat het Bayes Point Machine-classificatiemodel robuuster en eenvoudiger te gebruiken is en u de tijdrovende stap voor het afstemmen van parameters kunt omzeilen.

Moduleparameters

Name	Bereik	Type	Standaard	Beschrijving
Aantal trainings iteraties	>= 1	Geheel getal	30	Geef het aantal iteraties op dat moet worden gebruikt bij het trainen
Bias opnemen	Alle	Boolean-waarde	True	Aangeven of een constante functie of bias moet worden toegevoegd aan elke instantie
Onbekende waarden in categorische functies toestaan	Alle	Boolean-waarde	True	Als de optie Waar is, wordt er een extra niveau voor elke categorische kolom gemaakt. Alle niveaus in de testset die niet beschikbaar zijn in de trainingsset, worden toegewezen aan dit extra niveau.

Uitvoer

Naam	Type	Description
Niet-getraind model	ILearner-interface	Een ongetraind binair classificatiemodel

Zie ook

ClassificationA-Z-modulelijst

Delen via