Two-Class Bayes Point Machine
Belangrijk
De ondersteuning voor Azure Machine Learning-studio (klassiek) eindigt op 31 augustus 2024. U wordt aangeraden om vóór die datum over te stappen naar Azure Machine Learning.
Vanaf 1 december 2021 kunt u geen nieuwe resources voor Azure Machine Learning-studio (klassiek) meer maken. Tot en met 31 augustus 2024 kunt u de bestaande resources van Azure Machine Learning-studio (klassiek) blijven gebruiken.
- Zie informatie over het verplaatsen machine learning van ML Studio (klassiek) naar Azure Machine Learning.
- Meer informatie over Azure Machine Learning.
De documentatie van ML-studio (klassiek) wordt buiten gebruik gesteld en wordt in de toekomst mogelijk niet meer bijgewerkt.
Hiermee maakt u een binair classificatiemodel voor bayes-machines
Categorie: Machine Learning/ Model/classificatie initialiseren
Notitie
Van toepassing op: Machine Learning Studio (klassiek)
Vergelijkbare modules voor slepen en neerzetten zijn beschikbaar in Azure Machine Learning designer.
Moduleoverzicht
In dit artikel wordt beschreven hoe u de module Two-Class Bayes Point Machine in Machine Learning Studio (klassiek) gebruikt om een ongetraind binair classificatiemodel te maken.
Het algoritme in deze module maakt gebruik van een Bayesiaanse benadering van lineaire classificatie, de 'Bayes Point Machine'. Dit algoritme benadert efficiënt het theoretisch optimale Bayesiaanse gemiddelde van lineaire classificaties (in termen van generalisatieprestaties) door één 'gemiddelde' classificatie te kiezen, de Bayes Point. Omdat de Bayes Point-machine een Bayesisch classificatiemodel is, is deze niet gevoelig voor overfitting voor de trainingsgegevens.
Zie het bericht van Chris Machine Learning blog: Embracing Uncertainty - Probabilistic Inference (Blog van Microsoft Machine Learning: Embracing Uncertainty - Probabilistic Inference) voor meer informatie.
Een Bayes PointTwo-Class machine configureren
Voeg Machine Learning Bayes Point Machine-module met twee klassen toe aan uw experiment in Machine Learning Studio (klassiek). U vindt de module onder Machine Learning, Model initialiseren, Classificatie.
Bij Aantal trainings iteraties typt u een getal om op te geven hoe vaak het message-passing algoritme de trainingsgegevens door itereert. Normaal gesproken moet het aantal iteraties worden ingesteld op een waarde in het bereik 5 – 100.
Hoe hoger het aantal trainings iteraties, hoe nauwkeuriger de voorspellingen; De training verloopt echter langzamer.
Voor de meeste gegevenssets is de standaardinstelling van 30 trainings iteraties voldoende voor het algoritme om nauwkeurige voorspellingen te doen. Soms kunnen nauwkeurige voorspellingen worden gedaan met minder iteraties. Voor gegevenssets met sterk gecorreleerde functies kunt u profiteren van meer trainings iteraties.
Selecteer de optie Vooroordelen opnemen als u een constante functie of bias wilt toevoegen aan elke instantie in training en voorspelling.
Het is noodzakelijk om een bias op te nemen wanneer de gegevens nog geen constante functie bevatten.
Selecteer de optie Onbekende waarden toestaan in categorische functies om een groep voor onbekende waarden te maken.
Als u deze optie uitselecteert, kan het model alleen de waarden accepteren die zijn opgenomen in de trainingsgegevens.
Als u deze optie selecteert en onbekende waarden toestaat, is het model mogelijk minder nauwkeurig voor bekende waarden, maar kan het betere voorspellingen geven voor nieuwe (onbekende) waarden.
Voeg een exemplaar van de module Train Model en uw trainingsgegevens toe.
Verbinding maken trainingsgegevens en de uitvoer van de module Bayes Point Machine met twee klassen door aan de module Train Model en kies de labelkolom.
Voer het experiment uit.
Resultaten
Nadat de training is voltooid, klikt u met de rechtermuisknop op de uitvoer van de module Train Model om de resultaten weer te geven:
Selecteer Visualize (Visualiseren) voor een overzicht van de parameters van het model, samen met de functiegewichten die tijdens de training zijn geleerd.
Als u het model wilt opslaan voor later gebruik, klikt u met de rechtermuisknop op de uitvoer van MOdel trainen en selecteert u Opslaan als getraind model.
Als u voorspellingen wilt doen, gebruikt u het getrainde model als invoer voor de module Score Model .
Het ongetrainde model kan ook worden doorgegeven aan het model voor kruisvalidatie voor kruisvalidatie op een gelabelde gegevensset.
Voorbeelden
Als u wilt zien hoe Two-Class Bayes Point Machine wordt gebruikt in machine learning, bekijkt u deze voorbeeldexperimenten in Azure AI Gallery:
- Binaire classificaties vergelijken: in dit voorbeeld wordt het gebruik van meerdere classificaties met twee klassen gedemonstreerd.
Technische opmerkingen
Deze sectie bevat implementatiedetails en veelgestelde vragen over dit algoritme.
Details van het oorspronkelijke onderzoek en de onderliggende theorie zijn beschikbaar in dit document (PDF): Bayes Point Machines, door Pdf, door Graepe en
Deze implementatie verbetert echter op verschillende manieren het oorspronkelijke algoritme:
Het maakt gebruik van het algoritme voor het doorgeven van berichten naar verwachting. Zie A family of algorithms for approximate Bayesian inference (Een familie van algoritmen voor geschatte Bayesiaanse deferentie) voor meer informatie.
Een parameter-opruiming is niet vereist.
Voor deze methode is niet vereist dat gegevens worden genormaliseerd.
Deze verbeteringen zorgen ervoor dat het Bayes Point Machine-classificatiemodel robuuster en eenvoudiger te gebruiken is en u de tijdrovende stap voor het afstemmen van parameters kunt omzeilen.
Moduleparameters
Name | Bereik | Type | Standaard | Beschrijving |
---|---|---|---|---|
Aantal trainings iteraties | >= 1 | Geheel getal | 30 | Geef het aantal iteraties op dat moet worden gebruikt bij het trainen |
Bias opnemen | Alle | Boolean-waarde | True | Aangeven of een constante functie of bias moet worden toegevoegd aan elke instantie |
Onbekende waarden in categorische functies toestaan | Alle | Boolean-waarde | True | Als de optie Waar is, wordt er een extra niveau voor elke categorische kolom gemaakt. Alle niveaus in de testset die niet beschikbaar zijn in de trainingsset, worden toegewezen aan dit extra niveau. |
Uitvoer
Naam | Type | Description |
---|---|---|
Niet-getraind model | ILearner-interface | Een ongetraind binair classificatiemodel |