Exploration du modèle Decision Tree (Didacticiel sur l'exploration de données de base)
L'algorithme MDT (Microsoft Decision Tree) prédit quelles colonnes influencent la décision d'acheter un vélo en fonction des colonnes restantes dans le jeu d'apprentissage.
La Visionneuse d'arbre de décision de Microsoft fournit les onglets suivants à utiliser pour explorer des modèles d'exploration de données d'arbre de décision :
Arbre de décision
Réseau de dépendances
Les sections suivantes décrivent comment sélectionner la visionneuse appropriée et explorer les autres modèles d'exploration de données.
Onglet Arbre de décision
Sous l'onglet Arbre de décision, vous pouvez visualiser tous les modèles d'arbres qui composent un modèle d'exploration de données.
Étant donné que le modèle de publipostage ciblé du projet de ce didacticiel contient uniquement un seul attribut prévisible, Bike Buyer, il n'y a qu'un seul arbre à afficher. Si plusieurs arbre existaient, vous pourriez utiliser la case Arbre pour choisir un autre arbre.
L'examen du modèle TM_Decision_Tree dans la visionneuse d'arbre de décision révèle que l'âge est le seul facteur important pour prédire l'achat de vélos. Chose intéressante, une fois que vous regroupez les clients par âge, la branche suivante de l'arbre est différente pour chaque nœud d'âge. En explorant l'onglet Arbre de décision, nous pouvons conclure que les acheteurs âgés de 34 à 40 ans possédant une seule voiture ou n'en possédant aucune ont de grandes chances d'acheter un vélo et que les clients plus jeunes qui vivent dans la région Pacific et qui possèdent une seule voiture ou n'en possèdent aucune ont également de grandes chances d'acheter un vélo.
Pour explorer le modèle sous l'onglet Arbre de décision
Sélectionnez l'onglet Visionneuse de modèle d'exploration de données dans le Concepteur d'exploration de données.
Par défaut, le concepteur s'ouvre sur le premier modèle ajouté à la structure, le cas échéant, TM_Decision_Tree.
Utilisez les boutons de la loupe pour ajuster la taille d'affichage de l'arbre.
Par défaut, la visionneuse d'arborescences Microsoft affiche uniquement les trois premiers niveaux de l'arbre. Si l'arbre contient moins de trois niveaux, la visionneuse affiche uniquement les niveaux existants. Vous pouvez afficher davantage de niveaux en utilisant le curseur Afficher le niveau ou la liste Expansion par défaut.
Faites glisser le curseur Afficher le niveau jusqu'à la quatrième barre.
Affectez au paramètre Arrière-plan la valeur 1.
En modifiant le paramètre Arrière-plan, vous pouvez rapidement voir le nombre de cas dans chaque nœud présentant la valeur cible 1 pour [Bike Buyer]. Souvenez-vous que dans ce scénario particulier, chaque cas représente un client. La valeur 1 indique que le client a acheté un vélo précédemment ; la valeur 0 indique que le client n'en a pas acheté. Plus l'ombrage du nœud est foncé, plus le pourcentage de cas dans le nœud possédant la valeur cible est élevé.
Placez votre curseur au-dessus du nœud étiqueté Tout. Une info-bulle affiche les informations suivantes :
Nombre total de cas
Nombre de cas n'ayant pas acheté de vélo
Nombre de cas ayant acheté un vélo
Nombre de cas avec des valeurs manquantes pour [Bike Buyer]
Vous pouvez également placer votre curseur au-dessus d'un nœud dans l'arbre pour voir la condition requise afin d'atteindre ce nœud depuis le nœud qui le précède. Vous pouvez également afficher ces mêmes informations dans la Légende d'exploration de données.
Cliquez sur le nœud correspondant à Age >= 34 and < 41. L'histogramme s'affiche sous la forme d'une fine barre horizontale sur le nœud et représente la distribution des clients dans cette tranche d'âge qui ont acheté (rose) et qui n'ont pas acheté (bleu) un vélo par le passé. La visionneuse nous indique qu'il est probable que les clients âgés de 34 à 40 ans possèdent une seule voiture ou n'en possédant aucune achètent un vélo. En approfondissant, nous découvrons que la probabilité d'acheter un vélo augmente si le client est en fait âgé de 38 à 40 ans.
Étant donné que vous avez activé l'extraction lorsque vous avez créé la structure et le modèle, vous pouvez extraire des informations détaillées des cas du modèle et de la structure d'exploration de données, notamment les colonnes qui n'ont pas été incluses dans le modèle d'exploration de données (par exemple, emailAddress, FirstName).
Pour plus d'informations, consultez Utilisation de l'extraction sur les modèles et les structures d'exploration de données (Analysis Services - Exploration de données).
Pour extraire des données de cas
Cliquez avec le bouton droit sur un nœud et sélectionnez Extraire, puis Colonnes de modèle uniquement.
Les détails de chaque cas d'apprentissage s'affichent au format feuille de calcul. Ces détails viennent de la vue vTargetMail que vous avez sélectionnée comme table de cas lors de la génération de la structure d'exploration de données.
Cliquez avec le bouton droit sur un nœud et sélectionnez Extraire, puis Colonnes de structure et de modèle.
La même feuille de calcul s'affiche avec les colonnes de structure ajoutées à la fin.
Retour en haut
Onglet Réseau de dépendances
L'onglet Réseau de dépendances affiche les relations entre les attributs qui déterminent la capacité de prévision du modèle d'exploration de données. La Visionneuse du réseau de dépendance renforce nos conclusions selon lesquelles l'âge et la région sont des facteurs importants pour prédire l'achat de vélos.
Pour explorer le modèle sous l'onglet Réseau de dépendances
Cliquez sur le nœud Bike Buyer pour identifier ses dépendances.
Le nœud central du réseau de dépendances, Bike Buyer, représente l'attribut prévisible du modèle d'exploration de données. L'ombrage rose indique que tous les attributs ont des répercussions sur l'achat de vélos.
Ajustez le curseur Tous les liens pour identifier l'attribut le plus influent.
Si vous faites glisser le curseur vers le bas, seuls les attributs qui ont la plus grande incidence sur la colonne [Bike Buyer] restent affichés. En ajustant le curseur, vous pouvez découvrir que l'âge et la région sont les facteurs les plus importants pour prédire si quelqu'un va acheter un vélo.
Tâche suivante de la leçon
Exploration du modèle de clustering (Didacticiel sur l'exploration de données de base)
Voir aussi