Two-Class Bayes Point Machine
Wichtig
Der Support für Machine Learning Studio (klassisch) endet am 31. August 2024. Es wird empfohlen, bis zu diesem Datum auf Azure Machine Learning umzustellen.
Ab dem 1. Dezember 2021 können Sie keine neuen Ressourcen in Machine Learning Studio (klassisch) mehr erstellen. Bis zum 31. August 2024 können Sie die vorhandenen Ressourcen in Machine Learning Studio (klassisch) weiterhin verwenden.
- Siehe Migrieren zu Azure Machine Learning
- Weitere Informationen zu Azure Machine Learning.
Die Dokumentation zu ML Studio (klassisch) wird nicht mehr fortgeführt und kann künftig nicht mehr aktualisiert werden.
Erstellt ein binären Bayes Point Machine-Klassifizierungsmodell
Kategorie: Machine Learning/Modell initialisieren/Klassifizierung
Hinweis
Gilt nur für: Machine Learning Studio (klassisch)
Ähnliche Drag & Drop-Module sind im Azure Machine Learning-Designer verfügbar.
Modulübersicht
In diesem Artikel wird beschrieben, wie Sie das Modul Two-Class Bayes Point Machine in Machine Learning Studio (klassisch) verwenden, um ein untrainiertes binäres Klassifizierungsmodell zu erstellen.
Der Algorithmus in diesem Modul verwendet einen Bayes-Ansatz für die lineare Klassifizierung, der als "Bayes Point Machine" bezeichnet wird. Dieser Algorithmus nähert sich effizient dem theoretisch optimalen Bayes-Durchschnitt linearer Klassifizierer (im Hinblick auf die Verallgemeinerungsleistung), indem er einen "durchschnittlichen" Klassifizierer, den Bayes Point, auswählt. Da die Bayes Point Machine ein Bayessches Klassifizierungsmodell ist, neigt sie nicht zur Überanpassung der Trainingsdaten.
Weitere Informationen finden Sie im Beitrag von Chris Benign im Microsoft Machine Learning-Blog: Umarmung von Unsicherheit – probabilistischer Rückschluss.
Konfigurieren von Two-Class Bayes Point Machine
Fügen Sie in Machine Learning Studio (klassisch) ihrem Experiment das Modul Two-Class Bayes Point Machine hinzu. Sie finden das Modul unter Machine Learning, Modell initialisieren, Klassifizierung.
Geben Sie unter Anzahl der Trainingsiterationen eine Zahl ein, um anzugeben, wie oft der Algorithmus zur Nachrichtenübergabe die Trainingsdaten durchläuft. Die Anzahl der Iterationen sollte in der Regel auf einen Wert im Bereich von 5 bis 100 festgelegt werden.
Je höher die Anzahl der Trainingsiterationen, desto genauer die Vorhersagen. Allerdings dauert das Training länger.
Bei den meisten Datasets reicht die Standardeinstellung von 30 Trainingsiterationen für den Algorithmus aus, um exakte Vorhersagen zu treffen. Mitunter lassen sich mit weniger Iterationen exakte Vorhersagen erzielen. Datasets mit hoch korrelierte Merkmalen können von weiteren Trainingsiterationen profitieren.
Wählen Sie die Option Voreingenommenheit einschließen aus, wenn jeder Instanz im Training und in der Vorhersage ein konstantes Feature oder eine Konstante hinzugefügt werden soll.
Das Einschließen eines Bias ist erforderlich, wenn die Daten nicht bereits über ein konstantes Merkmal verfügen.
Wählen Sie die Option Unbekannte Werte in kategorischen Features zulassen aus, um eine Gruppe für unbekannte Werte zu erstellen.
Wenn Sie diese Option deaktivieren, akzeptiert das Modell nur Werte, die in den Trainingsdaten enthalten sind.
Wenn Sie diese Option auswählen und unbekannte Werte zulassen, ist das Modell für bekannte Werte möglicherweise weniger präzise, kann aber bessere Vorhersagen für neue (unbekannte) Werte liefern.
Fügen Sie eine Instanz des Moduls Train Model und Ihre Trainingsdaten hinzu.
Verbinden die Trainingsdaten und die Ausgabe des Moduls Two-Class Bayes Point Machine an das Modul Train Model an, und wählen Sie die Bezeichnungsspalte aus.
Führen Sie das Experiment aus.
Ergebnisse
Klicken Sie nach Abschluss des Trainings mit der rechten Maustaste auf die Ausgabe des Moduls Train Model , um die Ergebnisse anzuzeigen:
Wählen Sie Visualisieren aus, um eine Zusammenfassung der Parameter des Modells zusammen mit den Featuregewichtungen anzuzeigen, die sie aus dem Training gelernt haben.
Um das Modell zur späteren Verwendung zu speichern, klicken Sie mit der rechten Maustaste auf die Ausgabe von Train MOdel, und wählen Sie Save as Trained Model (Als trainiertes Modell speichern) aus.
Verwenden Sie zum Treffen von Vorhersagen das trainierte Modell als Eingabe für das Modul Score Model .
Das untrainierte Modell kann auch zur Kreuzvalidierung für ein bezeichnetes DataSet an das Kreuzvalidierungsmodell übergeben werden.
Beispiele
Informationen dazu, wie der Two-Class Bayes Point Machine beim maschinellen Lernen verwendet wird, finden Sie in den folgenden Beispielexperimenten im Azure KI-Katalog:
- Vergleichen von binären Klassifizierern: In diesem Beispiel wird die Verwendung mehrerer Klassifizierungen mit zwei Klassen veranschaulicht.
Technische Hinweise
Dieser Abschnitt enthält Implementierungsdetails und häufig gestellte Fragen zu diesem Algorithmus.
Details aus der ursprünglichen Forschung und der zugrunde liegenden Theorie sind in diesem Dokument (PDF) verfügbar: Bayes Point Machines, vonIer, Graepe undSchreib.
Diese Implementierung verbessert den ursprünglichen Algorithmus jedoch auf verschiedene Weise:
Sie verwendet den Message-Passing-Algorithmus Expectation Propagation. Weitere Informationen finden Sie unter Eine Familie von Algorithmen für den ungefähren Bayes-Rückschluss.
Ein Parameter-Sweep ist nicht erforderlich.
Für diese Methode ist es nicht erforderlich, dass Daten normalisiert werden.
Diese Verbesserungen machen das Bayes Point Machine-Klassifizierungsmodell robuster und benutzerfreundlicher, und der zeitaufwändige Schritt der Parameteroptimierung entfällt.
Modulparameter
Name | Range | type | Standard | Beschreibung |
---|---|---|---|---|
Anzahl der Trainingsiterationen | >=1 | Integer | 30 | Geben Sie die Anzahl der Iterationen für das Training an. |
Include bias | Any | Boolean | True | Geben Sie an, ob jeder Instanz ein konstantes Merkmal oder ein Bias hinzugefügt werden soll. |
Allow unknown values in categorical features | Any | Boolean | True | Bei "True" wird eine zusätzliche Ebene für jede Kategoriespalte erstellt. Alle Ebenen im Testdataset, die nicht im Trainingsdataset zur Verfügung stehen, werden dieser zusätzlichen Ebene zugeordnet. |
Output
Name | Type | BESCHREIBUNG |
---|---|---|
Untrainiertes Modell | ILearner-Schnittstelle | Ein untrainiertes binäres Klassifizierungsmodell |