Choisir la colonne à utiliser pour tester un modèle d'exploration de données
Avant de pouvoir mesurer la précision d'un modèle d'exploration de données, vous devez déterminer le résultat que vous voulez évaluer. La plupart des modèles d'exploration de données requièrent que vous choisissiez au moins une colonne à utiliser comme attribut prédictible lorsque vous créez le modèle. Par conséquent, lorsque vous testez la précision du modèle, vous devez généralement sélectionner cet attribut comme devant être testé.
La liste suivante décrit des points supplémentaires à prendre en considération pour choisir l'attribut prédictible à utiliser dans le test :
Certains types de modèles d’exploration de données peuvent prédire plusieurs attributs, tels que les réseaux neuronaux, qui peuvent explorer les relations entre de nombreux attributs.
D’autres types de modèles d’exploration de données, tels que les modèles clustering, n’ont pas nécessairement d’attribut prédictible. Les modèles de clustering ne peuvent être testés que s'ils ont un attribut prédictible.
Créer un nuage de points ou mesurer la précision d'un modèle de régression requiert que vous choisissiez un attribut prédictible continu comme résultat. Dans ce cas, vous ne pouvez pas spécifier une valeur cible. Si vous créez autre chose qu’un nuage de points, la colonne de structure d’exploration de données sous-jacente doit également avoir un type de contenu Discret ou Discrétisé.
Si vous choisissez un attribut discret comme résultat prédictible, vous pouvez également spécifier une valeur cible, ou vous pouvez laisser le champ Prédire la valeur vide. Si vous incluez une valeur de prédiction, le graphique mesure uniquement l’efficacité du modèle à prédire la valeur cible. Si vous ne spécifiez pas de résultat cible, le modèle est mesuré pour sa précision dans la prédiction de tous les résultats.
Si vous voulez inclure plusieurs modèles et les comparer dans un graphique d'analyse de précision unique, tous les modèles doivent utiliser la même colonne prédictible.
Lorsque vous créez un rapport de validation croisée, Analysis Services analyse automatiquement tous les modèles qui ont le même attribut prédictible.
Lorsque l’option Synchroniser les colonnes et les valeurs de prédiction est sélectionnée, Analysis Services choisit automatiquement les colonnes prédictibles qui ont les mêmes noms et les mêmes types de données correspondants. Si vos colonnes ne répondent pas à ces critères, vous pouvez désactiver cette option et choisir manuellement une colonne prédictible. Vous devrez peut-être le faire si vous testez le modèle avec un jeu de données externes qui n'a pas les mêmes colonnes que le modèle. Toutefois, si vous choisissez une colonne dont le type de données est incorrect, vous obtiendrez une erreur ou des résultats incorrects.
Spécifier le résultat à prédire
Double-cliquez sur la structure d'exploration de données pour l'ouvrir dans le Concepteur d'exploration de données.
Sélectionnez l’onglet Graphique d’analyse de précision de l’exploration de données .
Sélectionnez l’onglet Sélection d’entrée .
Sous l’onglet Sélection d’entrée , sous Nom de la colonne prédictible, sélectionnez une colonne prédictible pour chaque modèle que vous incluez dans le graphique.
Les colonnes du modèle d’exploration de données qui sont disponibles dans la zone Nom de la colonne prédictible sont uniquement celles dont le type d’utilisation est Prédire ou Prédire uniquement.
Si vous souhaitez déterminer l’élévation pour un modèle, vous devez sélectionner une valeur de résultat spécifique à mesurer dans la liste Prédire la valeur .
Voir aussi
Choisir et mapper les données de test du modèle
Choisir un type de graphique d'analyse de précision et définir des options de graphique