Leçon 2 : Ajout de modèles d’exploration de données à la structure d’exploration de données Market Basket
Dans cette leçon, vous allez ajouter deux modèles d’exploration de données à la structure d’exploration de données Market Basket que vous avez créée dans La leçon 1 : Création de la structure d’exploration de données Market Basket. Ces modèles d'exploration de données vous permettent de créer des prédictions.
Pour prédire les types de produits que les clients ont tendance à acheter en même temps, vous allez créer deux modèles d’exploration de données à l’aide de l’algorithme d’association Microsoft et deux valeurs différentes pour le paramètre MINIMUM_PROBABILTY .
MINIMUM_PROBABILTY est un paramètre d’algorithme Microsoft Association qui permet de déterminer le nombre de règles qu’un modèle d’exploration de données contiendra en spécifiant la probabilité minimale qu’une règle doit avoir. Par exemple, la valeur 0,4 spécifie qu'une règle peut être générée uniquement si la combinaison des produits que la règle décrit présente une probabilité d'occurrence d'au moins quarante pour cent.
Vous verrez l’effet de la modification du paramètre MINIMUM_PROBABILTY dans une leçon ultérieure.
Instruction ALTER MINING STRUCTURE
Pour ajouter un modèle d’exploration de données qui contient une table imbriquée à une structure d’exploration de données, vous utilisez l’instruction ALTER MINING STRUCTURE (DMX). Le code de l’instruction peut être divisé en parties suivantes :
Identification de la structure d'exploration de données
Attribution d'un nom au modèle d'exploration de données
Définition de la colonne clé
Définition des colonnes d'entrée et des colonnes prédictibles
Définition des colonnes de la table imbriquée
Identification des modifications d'algorithme et de paramètre
L'exemple générique suivant utilise l'instruction ALTER MINING STRUCTURE
qui ajoute un modèle d'exploration de données à une structure comportant des colonnes de tables imbriquées :
ALTER MINING STRUCTURE [<Mining Structure Name>]
ADD MINING MODEL [<Mining Model Name>]
(
[<key column>],
<mining model column> <usage>,
<table columns>
( [<nested key column>],
<nested mining model columns> )
) USING <algorithm>( <algorithm parameters> )
La première ligne du code identifie la structure d'exploration de données existante à laquelle le modèle d'exploration de données sera ajouté :
ALTER MINING STRUCTURE [<mining structure name>]
La ligne suivante du code désigne le modèle d'exploration de données qui sera ajouté à la structure d'exploration de données :
ADD MINING MODEL [<mining model name>]
Pour plus d’informations sur le nommage d’un objet dans les extensions d’exploration de données (DMX), consultez Identificateurs (DMX).
Les lignes suivantes du code définissent les colonnes de la structure d’exploration de données qui seront utilisées par le modèle d’exploration de données :
[<key column>],
<mining model columns> <usage>,
Vous pouvez utiliser uniquement des colonnes qui existent déjà dans la structure d'exploration de données.
La première colonne dans la liste de colonnes de modèle d'exploration de données doit être la colonne clé dans la structure d'exploration de données. Toutefois, vous n’avez pas besoin de taper KEY
après la colonne clé pour spécifier l’utilisation. En effet, vous avez déjà défini la colonne en tant que clé lorsque vous avez créé la structure d'exploration de données.
Les lignes restantes spécifient l'utilisation des colonnes dans le nouveau modèle d'exploration de données. Vous pouvez spécifier qu’une colonne dans le modèle d’exploration de données sera utilisée pour la prédiction à l’aide de la syntaxe suivante :
<column name> PREDICT,
Si vous ne spécifiez pas d'utilisation, vous n'avez pas besoin d'inclure une colonne de structure d'exploration de données dans la liste. Toutes les colonnes utilisées par la structure d'exploration de données référencée sont automatiquement mises à la disposition des modèles d'exploration de données basés sur cette structure. Toutefois, le modèle n'utilisera pas les colonnes pour la formation à moins que vous ne spécifiiez l'utilisation.
La dernière ligne du code définit l'algorithme et les paramètres d'algorithme employés pour générer le modèle d'exploration de données.
) USING <algorithm>( <algorithm parameters> )
Tâches de la leçon
Vous allez effectuer les tâches suivantes dans cette leçon :
ajouter un modèle d'exploration de données Association à la structure à l'aide de la probabilité par défaut ;
ajouter un modèle d'exploration de données Association à la structure à l'aide d'une probabilité modifiée.
Ajout d'un modèle d'exploration de données Association à la structure en utilisant le paramètre MINIMUM_PROBABILITY par défaut
La première tâche consiste à ajouter un nouveau modèle d’exploration de données à la structure d’exploration de données Market Basket basée sur l’algorithme Microsoft Association à l’aide de la valeur par défaut pour MINIMUM_PROBABILITY.
Pour ajouter un modèle d'exploration de données Association
Dans Explorateur d'objets, cliquez avec le bouton droit sur le instance d’Analysis Services, pointez sur Nouvelle requête, puis cliquez sur DMX.
L'Éditeur de requête s'ouvre et contient une nouvelle requête vide.
Notes
Pour créer une requête DMX sur une base de données Analysis Services spécifique, cliquez avec le bouton droit sur la base de données au lieu de la instance.
Copiez l'exemple générique de l'instruction
ALTER MINING STRUCTURE
dans la requête vide.Remplacez le code suivant :
<mining structure name>
par :
[Market Basket]
Remplacez le code suivant :
<mining model name>
par :
[Default Association]
Remplacez le code suivant :
[<key column>], <mining model columns>, <table columns> ( [<nested key column>], <nested mining model columns> )
par :
OrderNumber, [Products] PREDICT ( [Model] )
Dans ce cas, la table
[Products]
a été désignée comme colonne prédictible.
. Par ailleurs, la colonne[Model]
est incluse dans la liste des colonnes de la table imbriquée car il s'agit de la colonne clé de la table imbriquée.Notes
N'oubliez pas qu'une clé imbriquée est différente d'une clé de cas. Une clé de cas est un identificateur unique du cas, alors que la clé imbriquée est un attribut que vous souhaitez modéliser.
Remplacez le code suivant :
USING <algorithm>( <algorithm parameters> )
par :
Using Microsoft_Association_Rules
L'instruction obtenue doit se présenter comme suit :
ALTER MINING STRUCTURE [Market Basket] ADD MINING MODEL [Default Association] ( OrderNumber, [Products] PREDICT ( [Model] ) ) Using Microsoft_Association_Rules
Dans le menu Fichier , cliquez sur Enregistrer DMXQuery1.dmx sous.
Dans la boîte de dialogue Enregistrer sous, accédez au dossier approprié et nommez le fichier
Default_Association_Model.dmx
.Dans la barre d’outils, cliquez sur le bouton Exécuter .
Ajout d'un modèle d'exploration de données Association à la structure en modifiant le paramètre MINIMUM_PROBABILITY par défaut
La tâche suivante consiste à ajouter un nouveau modèle d’exploration de données à la structure d’exploration de données Market Basket en fonction de l’algorithme Microsoft Association et à remplacer la valeur par défaut de MINIMUM_PROBABILITY par 0,01. La modification du paramètre entraîne la création de règles supplémentaires par l’algorithme Microsoft Association.
Pour ajouter un modèle d'exploration de données Association
Dans Explorateur d'objets, cliquez avec le bouton droit sur le instance d’Analysis Services, pointez sur Nouvelle requête, puis cliquez sur DMX.
L'Éditeur de requête s'ouvre et contient une nouvelle requête vide.
Copiez l'exemple générique de l'instruction
ALTER MINING STRUCTURE
dans la requête vide.Remplacez le code suivant :
<mining structure name>
par :
Market Basket
Remplacez le code suivant :
<mining model name>
par :
[Modified Association]
Remplacez le code suivant :
<mining model columns>, <table columns> ( [<nested key column>], <nested mining model columns> )
par :
OrderNumber, [Products] PREDICT ( [Model] )
Dans ce cas, la table
[Products]
est désignée en tant que colonne prédictible. Par ailleurs, la colonne[MODEL]
est incluse dans la liste car il s'agit de la colonne clé dans la table imbriquée.Remplacez le code suivant :
USING <algorithm>( <algorithm parameters> )
par :
USING Microsoft_Association_Rules (Minimum_Probability = 0.1)
L'instruction obtenue doit se présenter comme suit :
ALTER MINING STRUCTURE [Market Basket] ADD MINING MODEL [Modified Assocation] ( OrderNumber, [Products] PREDICT ( [Model] ) ) USING Microsoft_Association_Rules (Minimum_Probability = 0.1)
Dans le menu Fichier , cliquez sur Enregistrer DMXQuery1.dmx sous.
Dans la boîte de dialogue Enregistrer sous, accédez au dossier approprié et nommez le fichier
Modified Association_Model.dmx
.Dans la barre d’outils, cliquez sur le bouton Exécuter .
Dans la leçon suivante, vous allez traiter la structure d'exploration de données Market Basket et ses modèles d'exploration de données associés.
Leçon suivante
Leçon 3 : Traitement de la structure d'exploration de données Market Basket