Didacticiel DMX Market Basket
Dans ce didacticiel, vous allez apprendre à créer et explorer des modèles d'exploration de données, ou à en effectuer l'apprentissage, à l'aide du langage de requête DMX (Data Mining Extensions). Vous utiliserez ensuite ces modèles d'exploration pour établir des prédictions décrivant les produits susceptibles d'être achetés simultanément.
Les modèles d’exploration de données seront créés à partir des données contenues dans l’exemple de base de données AdventureWorksDW2012 , qui stocke les données de la société fictive Adventure Works Cycles. Adventure Works Cycles est une grande entreprise de fabrication multinationale. L'entreprise fabrique et vend des vélos métalliques et des vélos en alliage sur les marchés nord-américain, européen et asiatique. Son siège qui compte 290 employés est situé à Bothell dans l'état de Washington aux États-Unis ; elle dispose de plusieurs équipes commerciales réparties dans diverses régions du monde constituant son marché de base.
Scénario du didacticiel
Adventure Works Cycles a décidé de créer une application personnalisée qui utilise des fonctionnalités d’exploration de données pour prédire les types de produits que leurs clients ont tendance à acheter en même temps. L'objectif de cette application personnalisée est de pouvoir spécifier un ensemble de produits et de prédire les autres produits qui seront achetés avec ces produits. Adventure Works Cycles utilisera ensuite ces informations pour ajouter une fonctionnalité de « suggestion » à leur site web, et également pour mieux organiser la façon dont ils présentent des informations à leurs clients.
Microsoft SQL Server Analysis Services fournit plusieurs outils qui peuvent être utilisés pour accomplir cette tâche :
Langage de requête DMX
Algorithme d’association Microsoft
Éditeur de requête dans SQL Server Management Studio
Les extensions d’exploration de données (DMX) sont un langage de requête fourni par Analysis Services que vous pouvez utiliser pour créer et utiliser des modèles d’exploration de données. L’algorithme Microsoft Association crée des modèles qui peuvent prédire les produits susceptibles d’être achetés ensemble.
L'objectif de ce didacticiel est de fournir des requêtes DMX à utiliser dans l'application personnalisée.
Pour plus d’informations : Solutions d’exploration de données
Structure et modèles d'exploration de données
Avant de commencer à créer des instructions DMX, il est important de comprendre les principaux objets que Analysis Services utilise pour créer des modèles d’exploration de données. La structure d’exploration de données est une structure de données qui définit le domaine de données à partir duquel les modèles d’exploration de données sont générés. Une seule structure d’exploration de données peut contenir plusieurs modèles d’exploration de données qui partagent le même domaine. Un modèle d'exploration applique un algorithme de modèle d'exploration aux données qui sont représentées par une structure d'exploration de données.
Les composants constituant la structure d'exploration de données sont les colonnes de structure d'exploration de données qui décrivent les données inscrites dans la source de données. Ces colonnes contiennent des informations, telles que le type de données, le type de contenu et le mode de distribution des données.
Les modèles d'exploration de données doivent contenir la colonne clé décrite dans la structure d'exploration de données, ainsi qu'un sous-ensemble des colonnes restantes. Le modèle d'exploration de données détermine l'usage de chaque colonne et définit l'algorithme utilisé pour sa création. Par exemple, dans DMX, vous pouvez définir une colonne comme étant une colonne clé ou une colonne PREDICT. Une colonne non définie est considérée comme une colonne d'entrée.
Deux méthodes permettent de créer des modèles d'exploration de données dans DMX. Vous pouvez soit créer ensemble la structure d'exploration de données et le modèle qui y est associé par le biais de l'instruction CREATE MINING MODEL
, soit créer d'abord une structure d'exploration de données à l'aide de l'instruction CREATE MINING STRUCTURE
, puis ajouter un modèle d'exploration de données à la structure à l'aide de l'instruction ALTER STRUCTURE
. Ces méthodes sont décrites ci-dessous.
CREATE MINING MODEL
Utilisez cette instruction pour créer en même temps une structure d'exploration de données et son modèle associé en utilisant le même nom. Le nom du modèle d'exploration de données est ajouté à la mention « Structure » pour le différencier de la structure d'exploration de données.
Cette instruction est utile si vous créez une structure d'exploration de données conçue pour accueillir un seul modèle d'exploration de données.
Pour plus d’informations, consultez CREATE MINING MODEL (DMX).
CREATE MINING STRUCTURE
Utilisez cette instruction pour créer une structure d'exploration de données sans modèle.
Lorsque vous utilisez CREATE MINING STRUCTURE, vous pouvez également créer un jeu de données d'exclusion qui peut être utilisé pour tester tous les modèles basés sur la même structure d'exploration de données.
Pour plus d’informations, consultez CREATE MINING STRUCTURE (DMX).
ALTER MINING STRUCTURE
Utilisez cette instruction pour ajouter un modèle d'exploration de données à une structure d'exploration de données existant déjà sur le serveur.
Plusieurs raisons peuvent vous inciter à ajouter plusieurs modèles d'exploration de données dans une structure d'exploration de données unique. Par exemple, vous pouvez créer plusieurs modèles d'exploration de données à l'aide de différents algorithmes pour savoir lequel fonctionne le mieux. Vous pouvez également créer plusieurs modèles d'exploration de données à l'aide du même algorithme, mais avec un paramètre défini différemment pour chaque modèle, afin de trouver la meilleure définition pour ce paramètre.
Pour plus d’informations, consultez ALTER MINING STRUCTURE (DMX).
Puisque vous allez créer une structure d'exploration de données dotée de plusieurs modèles d'exploration de données, vous devrez adopter la deuxième méthode de ce didacticiel.
Pour plus d'informations
Informations de référence sur les extensions d’exploration de données (DMX), présentation de l’instruction DMX Select, de la structure et de l’utilisation des requêtes de prédiction DMX
Contenu du didacticiel
Ce didacticiel contient les leçons suivantes :
Leçon 1 : Création de la structure d’exploration de données Market Basket
Dans cette leçon, vous allez apprendre à utiliser l'instruction CREATE
pour créer des structures d'exploration de données.
Leçon 2 : Ajout de modèles d’exploration de données à la structure d’exploration de données Market Basket
Dans cette leçon, vous allez apprendre à utiliser l'instruction ALTER
pour ajouter des modèles d'exploration de données à une structure d'exploration de données.
Leçon 3 : Traitement de la structure d’exploration de données Market Basket
Dans cette leçon, vous allez apprendre à utiliser l'instruction INSERT INTO
pour traiter des structures d'exploration de données et les modèles qui y sont associés.
Leçon 4 : Exécution de prédictions Market Basket
Dans cette leçon, vous allez apprendre à utiliser l'instruction PREDICTION JOIN
pour établir des prédictions par rapport à des modèles d'exploration de données.
Spécifications
Avant d'entamer ce didacticiel, assurez-vous que les éléments suivants sont installés :
Microsoft SQL Server
Microsoft SQL Server Analysis Services
Base de données AdventureWorksDW2012
Pour des raisons de sécurité, les bases de données exemples ne sont pas installées par défaut. Pour installer les exemples de bases de données officiels pour Microsoft SQL Server, accédez ou accédez à https://www.CodePlex.com/MSFTDBProdSamples la page d’accueil microsoft SQL Server Samples and Community Projects dans la section Exemples de produits Microsoft SQL Server. Cliquez sur Databases, puis cliquez sur l'onglet Releases et sélectionnez les bases de données souhaitées.
Remarque
Lorsque vous parcourez les didacticiels, il est recommandé d'ajouter les boutons Rubrique suivante et Rubrique précédente dans la barre d'outils de l'afficheur de document.
Voir aussi
Tutoriel DMX Bike Buyer
Tutoriel sur l’exploration de données de base
Leçon 3 : Création d’un scénario de panier de marché (didacticiel sur l’exploration de données intermédiaire)