Création d'une structure de modèle d'exploration de données pour le publipostage ciblé (Didacticiel sur l'exploration de données de base)
La première étape de la création d’un scénario de publipostage ciblé consiste à utiliser l’Assistant Exploration de données dans SQL Server Data Tools (SSDT) pour créer une structure d’exploration de données et un modèle d’exploration de données d’arborescence de décision.
Dans cette tâche, vous allez configurer une nouvelle structure d’exploration de données et ajouter un modèle d’exploration de données initial basé sur l’algorithme Microsoft Decision Trees. Pour créer la structure, vous allez sélectionner en premier des tables et des vues, puis vous identifierez quelles colonnes seront utilisées pour l'apprentissage et pour le test.
Pour créer une structure d'exploration de données pour le scénario de publipostage ciblé
Dans Explorateur de solutions, cliquez avec le bouton droit sur Structures d’exploration de données, puis sélectionnez Nouvelle structure d’exploration de données pour démarrer l’Assistant Exploration de données.
Dans la page Assistant Exploration de données , cliquez sur Suivant.
Dans la page Sélectionner la méthode de définition , vérifiez que l’option À partir d’une base de données relationnelle ou d’un entrepôt de données existant est sélectionnée, puis cliquez sur Suivant.
Dans la page Créer la structure d’exploration de données, sous Quelle technique d’exploration de données voulez-vous utiliser ?, sélectionnez Arbres de décision Microsoft.
Notes
Si vous obtenez un avertissement indiquant qu'aucun algorithme d'exploration de données n'a été trouvé, les propriétés du projet ne sont peut-être pas configurées correctement. Cet avertissement se produit lorsque le projet tente de récupérer une liste d’algorithmes d’exploration de données à partir du serveur Analysis Services et ne trouve pas le serveur. Par défaut, SQL Server Data Tools utiliser localhost comme serveur. Si vous utilisez une instance différente ou une instance nommée, vous devez modifier les propriétés du projet. Pour plus d’informations, consultez Création d’un projet Analysis Services (tutoriel d’exploration de données de base).
Cliquez sur Suivant.
Dans la page Sélectionner une vue de source de données, dans le volet Affichages de source de données disponibles , sélectionnez Publipostage ciblé. Vous pouvez cliquer sur Parcourir pour afficher les tables dans la vue de source de données, puis cliquez sur Fermer pour revenir à l’Assistant.
Cliquez sur Suivant.
Dans la page Spécifier les types de table, sélectionnez la zone case activée dans la colonne Case pour que vTargetMail l’utilise comme table de cas, puis cliquez sur Suivant. Vous utiliserez ultérieurement la table ProspectiveBuyer à des fins de test ; ignorez-la pour le moment.
Dans la page Spécifier les données d’entraînement , vous identifierez au moins une colonne prévisible, une colonne clé et une colonne d’entrée pour votre modèle. Sélectionnez la zone case activée dans la colonne Prédictible de la ligne BikeBuyer.
Notes
Remarquez l'avertissement en bas de la fenêtre. Vous ne pourrez pas accéder à la page suivante tant que vous n’aurez pas sélectionné au moins une colonne Entrée et une colonne Prédictible .
Cliquez sur Suggérer pour ouvrir la boîte de dialogue Suggérer des colonnes associées .
Le bouton Suggérer est activé chaque fois qu’au moins un attribut prédictible a été sélectionné. La boîte de dialogue Suggérer des colonnes associées répertorie les colonnes qui sont les plus étroitement liées à la colonne prédictible et classe les attributs en fonction de leur corrélation avec l’attribut prédictible. Les colonnes qui contiennent une corrélation significative (confiance supérieure à 95%) sont automatiquement sélectionnées pour être incluses dans le modèle.
Passez en revue les suggestions, puis cliquez sur Annuler pour ignorer les suggestions.
Notes
Si vous cliquez sur OK, toutes les suggestions répertoriées sont marquées comme colonnes d’entrée dans l’Assistant. Si vous acceptez uniquement certaines des suggestions, vous devez modifier les valeurs manuellement.
Vérifiez que la zone case activée dans la colonne Clé est sélectionnée dans la ligne CustomerKey.
Notes
Si la table source de la vue de source de données indique une clé, l'Assistant Exploration de données choisit automatiquement cette colonne comme clé du modèle.
Sélectionnez les zones case activée dans la colonne Entrée dans les lignes suivantes. Vous pouvez activer plusieurs colonnes en mettant en surbrillance une plage de cellules et en appuyant sur CTRL tout en activant une case à cocher.
Age
CommuteDistance
EnglishEducation
EnglishOccupation
Gender (Sexe)
GeographyKey
HouseOwnerFlag
MaritalStatus
NumberCarsOwned
NumberChildrenAtHome
Région
TotalChildren
YearlyIncome
Sur la colonne d'extrême gauche de la page, activez les cases à cocher dans les lignes suivantes.
AddressLine1
AddressLine2
DateFirstPurchase
EmailAddress
FirstName
LastName
Vérifiez que ces lignes n'ont des coches que dans la colonne gauche. Ces colonnes seront ajoutées à votre structure mais ne seront pas incluses dans le modèle. Toutefois, une fois le modèle construit, elles seront disponibles pour l'extraction et le test. Pour plus d’informations sur l’extraction, consultez Requêtes d’extraction (exploration de données)
Cliquez sur Suivant.
Tâche suivante de la leçon
Voir aussi
Spécifier les types des tables (Assistant Exploration de données)
Concepteur d’exploration de données
Algorithme MDT (Microsoft Decision Trees)