Importance de la fonctionnalité de permutation
Important
Le support de Machine Learning Studio (classique) prend fin le 31 août 2024. Nous vous recommandons de passer à Azure Machine Learning avant cette date.
À partir du 1er décembre 2021, vous ne pourrez plus créer de nouvelles ressources Machine Learning Studio (classique). Jusqu’au 31 août 2024, vous pouvez continuer à utiliser les ressources Machine Learning Studio (classique) existantes.
- Consultez les informations sur le déplacement des projets de machine learning de ML Studio (classique) à Azure Machine Learning.
- En savoir plus sur Azure Machine Learning.
La documentation ML Studio (classique) est en cours de retrait et ne sera probablement plus mise à jour.
Calcule les scores d'importance de fonctionnalité de permutation de variables de fonctionnalité avec un modèle et un jeu de données de test
Catégorie : modules de sélection de fonctionnalités
Notes
s’applique à: Machine Learning Studio (classic) uniquement
Des modules par glisser-déposer similaires sont disponibles dans Concepteur Azure Machine Learning.
Vue d’ensemble du module
cet article explique comment utiliser le module permutation feature importance dans Machine Learning Studio (classic) pour calculer un ensemble de scores d’importance de fonctionnalité pour votre jeu de données. Vous utilisez ces scores pour vous aider à déterminer les meilleures fonctionnalités à utiliser dans un modèle.
Dans ce module, les valeurs des fonctionnalités sont mélangées aléatoirement, une colonne à la fois, et les performances du modèle sont mesurées avant et après. Vous pouvez choisir l’une des métriques standards fournies pour mesurer les performances.
Les scores retournés par le module représentent la modification dans les performances d’un modèle formé, après permutation. Les fonctionnalités importantes sont généralement plus sensibles au processus de mélange et entraînent donc des scores d’importance plus élevés.
Cet article fournit une vue d’ensemble générale de l’importance des fonctionnalités de permutation, de sa base théorique et de ses applications dans Machine Learning : l' importance des fonctionnalités de permutation
Comment utiliser l’importance de la fonctionnalité de permutation
Pour générer un ensemble de scores de fonctionnalités, vous devez disposer d’un modèle déjà formé, ainsi que d’un jeu de données de test.
Ajoutez le module permutation Feature importance à votre expérience. Ce module figure dans la catégorie Sélection des caractéristiques.
Connectez un modèle formé à l’entrée gauche. Le modèle doit être un modèle de régression ou un modèle de classification.
Sur l’entrée droite, connectez un jeu de données, de préférence différent de celui utilisé pour l’apprentissage du modèle. Ce jeu de données est utilisé pour le calcul des scores basés sur le modèle formé et pour l’évaluation du modèle après la modification des valeurs des fonctionnalités.
Pour Valeur de départ aléatoire, saisissez une valeur à utiliser comme valeur de départ pour la répartition aléatoire. Si vous spécifiez 0 (valeur par défaut), un nombre est généré en fonction de l’horloge système.
Une valeur de départ est facultative, mais vous devez fournir une valeur si vous souhaitez que la reproductibilité s’effectue entre les exécutions de la même expérience.
Pour Métrique pour la mesure des performances, sélectionnez une métrique unique à utiliser lors du calcul de la qualité du modèle après la permutation.
Machine Learning Studio (classic) prend en charge les mesures suivantes, selon que vous évaluez un modèle de classification ou de régression :
Classification
Exactitude, Précision, Rappel, Perte moyenne de journal
Régression
Précision, rappel, erreur absolue moyenne, erreur quadratique moyenne racine, erreur absolue relative, erreur quadratique relative, coefficient de détermination
Pour obtenir une description plus détaillée de ces mesures d’évaluation et de la façon dont elles sont calculées, consultez évaluer.
Exécutez l’expérience.
Le module génère une liste de colonnes de fonctionnalités et les scores qui leur sont associés, classés dans l’ordre des scores, décroissant.
Exemples
Consultez les exemples d’expériences suivants dans la Azure ai Gallery:
Importance des fonctionnalités de permutation: montre comment utiliser ce module pour classer les variables de fonctionnalités d’un jeu de données dans l’ordre des scores d’importance de permutation.
Utilisation du module permutation Feature importance: illustre l’utilisation de ce module dans un service Web.
Notes techniques
Cette section contient des détails, des conseils et des réponses aux questions fréquentes concernant l’implémentation.
En quoi cela peut-il être comparé aux autres méthodes de sélection de fonctionnalités ?
L’importance de la fonctionnalité de permutation consiste à modifier de façon aléatoire les valeurs de chaque colonne de fonctionnalité, une colonne à la fois, puis à évaluer le modèle.
Les classements fournis par l’importance de la fonctionnalité de permutation sont souvent différents de ceux que vous obtenez à partir de la sélection de caractéristiques par filtrage, qui calcule les scores avant la création d’un modèle.
En effet, l’importance de la fonctionnalité de permutation ne mesure pas l’association entre une fonctionnalité et une valeur cible, mais elle capture à la place l’influence de chaque fonctionnalité sur les prédictions du modèle.
Entrées attendues
Nom | Type | Description |
---|---|---|
Modèle entraîné | Interface ILearner | Modèle formé de classification ou de régression |
Données de test | Table de données | Jeu de données de test pour le calcul de scores et l'évaluation d'un modèle après permutation des valeurs de fonctionnalité |
Paramètres du module
Nom | Type | Plage | Facultatif | Default | Description |
---|---|---|---|---|---|
Valeur initiale aléatoire | Entier | >=0 | Obligatoire | 0 | Valeur initiale du générateur de nombres aléatoires |
Métrique pour la mesure des performances | EvaluationMetricType | sélectionner dans la liste | Obligatoire | Classification - Précision | Sélectionner la métrique à utiliser lors de l’évaluation de la variabilité du modèle après permutations |
Sorties
Nom | Type | Description |
---|---|---|
Importance de la fonctionnalité | Table de données | Jeu de données contenant les résultats d'importance de fonctionnalité, en fonction de la mesure sélectionnée |
Exceptions
Exception | Description |
---|---|
Erreur 0062 | Une exception se produit lorsque l’on tente de comparer deux modèles avec des types d’apprenants différents. |
Erreur 0024 | Une exception se produit si le jeu de données ne contient pas de colonne d’étiquette. |
Erreur 0105 | Levée quand un fichier de définition de module définit un type de paramètre non pris en charge |
Erreur 0021 | Une exception se produit si le nombre de lignes de certains jeux de données transmis au module est trop faible. |
Voir aussi
Sélection de caractéristiques
Sélection de caractéristiques par filtrage
Analyse en composantes principales