Two-Class Bayes Point Machine
Important
Le support de Machine Learning Studio (classique) prend fin le 31 août 2024. Nous vous recommandons de passer à Azure Machine Learning avant cette date.
À partir du 1er décembre 2021, vous ne pourrez plus créer de nouvelles ressources Machine Learning Studio (classique). Jusqu’au 31 août 2024, vous pouvez continuer à utiliser les ressources Machine Learning Studio (classique) existantes.
- Consultez les informations sur le déplacement des projets de machine learning de ML Studio (classique) à Azure Machine Learning.
- En savoir plus sur Azure Machine Learning.
La documentation ML Studio (classique) est en cours de retrait et ne sera probablement plus mise à jour.
Crée un modèle de classification binaire Bayes Point Machine
catégorie : Machine Learning/initialiser le modèle/la Classification
Notes
s’applique à: Machine Learning Studio (classic) uniquement
Des modules par glisser-déposer similaires sont disponibles dans Concepteur Azure Machine Learning.
Vue d’ensemble du module
cet article explique comment utiliser le module Two-Class Bayes Point Machine dans Machine Learning Studio (classic) pour créer un modèle de classification binaire non formé.
L’algorithme de ce module utilise une approche bayésienne de la classification linéaire appelée « machine à points Bayes ». Cet algorithme se rapproche efficacement de la moyenne bayésienne théoriquement optimale des classifieurs linéaires (en termes de performances de généralisation) en choisissant un classifieur « moyen », le point de Bayes. Dans la mesure où Bayes Point Machine est un modèle de classification bayésien, il n'est pas sujet à un surajustement aux données d'apprentissage.
pour plus d’informations, consultez le billet de Chris Bishop sur le blog de Microsoft Machine Learning : adoption de l' incertitude-inférence probabiliste.
Comment configurer Two-Class machine à points de Bayes
dans Machine Learning Studio (classic), ajoutez le module Two-Class Bayes Point Machine à votre expérience. vous pouvez trouver le module sous Machine Learning, initialiser le modèle, Classification.
Pour nombre d’itérations d’apprentissage, tapez un nombre pour spécifier la fréquence à laquelle l’algorithme de transmission de messages itère au sein des données d’apprentissage. En général, le nombre d'itérations doit être compris entre 5 et 100.
Plus le nombre d'itérations d'apprentissage est élevé, plus les prédictions sont précises ; toutefois, l'apprentissage sera plus lent.
Pour la plupart des jeux de données, le paramètre par défaut de 30 itérations d'apprentissage est suffisant pour que l'algorithme effectue des prédictions précises. Des prédictions précises peuvent parfois être effectuées à l'aide de moins d'itérations. Pour les jeux de données avec des fonctionnalités hautement corrélées, il peut être avantageux d'indiquer un plus grand nombre d'itérations d'apprentissage.
Sélectionnez l’option inclure le décalagesi vous souhaitez ajouter une fonctionnalité constante ou un écart à chaque instance dans l’apprentissage et la prédiction.
L'inclusion d'un décalage est nécessaire lorsque les données ne contiennent pas déjà une fonctionnalité constante.
Sélectionnez l’option autoriser les valeurs inconnues dans les fonctionnalités catégoriquespour créer un groupe de valeurs inconnues.
Si cette option est désélectionnée, le modèle n’accepte que les valeurs contenues dans les données d’apprentissage.
Si vous sélectionnez cette option et que vous autorisez des valeurs inconnues, le modèle peut être moins précis pour les valeurs connues, mais il peut fournir de meilleures prédictions pour les nouvelles valeurs (inconnues).
Ajoutez une instance du module former le modèle et vos données d’apprentissage.
Connecter les données d’apprentissage et la sortie du module Two-Class Bayes Point Machine dans le module former le modèle , puis choisissez la colonne étiquette.
Exécutez l’expérience.
Résultats
Une fois l’apprentissage terminé, cliquez avec le bouton droit sur la sortie du module former le modèle pour afficher les résultats :
Pour afficher un résumé des paramètres du modèle, ainsi que les poids des fonctionnalités tirées de la formation, sélectionnez visualiser.
Pour enregistrer le modèle en vue d’une utilisation ultérieure, cliquez avec le bouton droit sur la sortie du modèle de formation, puis sélectionnez enregistrer en tant que modèle formé.
Pour effectuer des prédictions, utilisez le modèle formé comme entrée dans le module noter le modèle .
Le modèle non formé peut également être passé au modèle de validation croisée pour la validation croisée par rapport à un jeu de données étiqueté.
Exemples
Pour voir comment l’ordinateur Two-Class Bayes point est utilisé dans Machine Learning, consultez les exemples d’expériences suivants dans la Azure ai Gallery:
- Comparer les classifieurs binaires: cet exemple illustre l’utilisation de plusieurs classifieurs à deux classes.
Notes techniques
Cette section contient des détails sur l’implémentation et des questions fréquemment posées sur cet algorithme.
Les détails de la théorie de recherche d’origine et de la théorie sous-jacente sont disponibles dans ce document (PDF) : Bayes point machines, par Herbert, Graepe et Campbell
Toutefois, cette implémentation améliore l’algorithme d’origine de plusieurs façons :
Il utilise l'algorithme de transmission de messages d'expectation et de propagation. Pour plus d’informations, consultez une famille d’algorithmes pour obtenir une inférence bayésienle approximative.
Un balayage de paramètre n’est pas requis.
Cette méthode ne nécessite pas la normalisation des données.
Ces améliorations rendent le modèle de classification Bayes Point Machine plus robuste et plus facile à utiliser, et vous permettent d'ignorer l'étape laborieuse de réglage des paramètres.
Paramètres du module
Nom | Plage | Type | Default | Description |
---|---|---|---|---|
Nombre d’itérations d’entraînement | >=1 | Integer | 30 | Spécifier le nombre d'itérations à utiliser lors de l'apprentissage |
Inclure le décalage | Quelconque | Boolean | True | Indiquer si une fonction constante ou un décalage doit être ajouté à chaque instance |
Autoriser les valeurs inconnues dans les fonctionnalités catégorielles | Quelconque | Boolean | True | Si la valeur est true, un niveau supplémentaire est créé pour chaque colonne catégorielle. Tous les niveaux du jeu de données de test qui ne sont pas disponibles dans le jeu de données d'apprentissage sont mappés à ce niveau supplémentaire. |
Output
Nom | Type | Description |
---|---|---|
Untrained model (Modèle non entraîné) | Interface ILearner | Modèle de classification binaire non formé |