Leçon 3 : Traitement de la structure d'exploration de données Market Basket
Dans cette leçon, vous allez utiliser l’instruction INSERT INTO (DMX) et vAssocSeqLineItems et vAssocSeqOrders de l’exemple de base de données AdventureWorksDW2012 pour traiter les structures d’exploration de données et les modèles d’exploration de données que vous avez créés dans la leçon 1 : Création de la structure d’exploration de données de panier de marché et leçon 2 : Ajout de modèles d’exploration de données à la structure d’exploration de données du panier de marché.
Lorsque vous traitez une structure d’exploration de données, Analysis Services lit les données sources et génère les structures qui prennent en charge les modèles d’exploration de données. Lorsque vous traitez un modèle d’exploration de données, les données définies par la structure d’exploration de données sont transmises via l’algorithme d’exploration de données que vous avez choisi. L'algorithme recherche des tendances et des modèles, puis stocke les informations recueillies dans le modèle d'exploration de données. Par conséquent, le modèle d'exploration de données ne contient pas les données source réelles mais plutôt les informations recueillies par l'algorithme. Pour plus d’informations sur le traitement des modèles d’exploration de données, consultez Exigences et considérations relatives au traitement (exploration de données).
Si vous modifiez une colonne de structure ou les données source, vous devez simplement retraiter la structure d'exploration de données. Si vous ajoutez un modèle d'exploration de données à une structure d'exploration de données déjà traitée, vous pouvez utiliser l'instruction INSERT INTO MINING MODEL
pour effectuer l'apprentissage du nouveau modèle d'exploration de données sur les données existantes.
Comme la structure d'exploration de données Market Basket contient une table imbriquée, vous devez définir les colonnes d'exploration de données sur lesquelles effectuer l'apprentissage à l'aide de la structure de la table imbriquée et utiliser la commande SHAPE
pour définir les requêtes chargées d'extraire les données d'apprentissage à partir des tables source.
Instruction INSERT INTO
Pour entraîner la structure d’exploration de données Market Basket et ses modèles d’exploration de données associés, utilisez l’instruction INSERT INTO (DMX). Le code de cette instruction peut être divisé selon les sections suivantes :
Identification de la structure d'exploration de données
Liste des colonnes de la structure d'exploration de données
Définition des données d'apprentissage à l'aide de l'instruction
SHAPE
L'exemple générique suivant utilise l'instruction INSERT INTO
:
INSERT INTO MINING STRUCTURE [<mining structure name>]
(
<mining structure columns>
[<nested table>]
( SKIP, <skipped column> )
)
SHAPE {
OPENQUERY([<datasource>],'<SELECT statement>') }
APPEND
(
{OPENQUERY([<datasource>],'<nested SELECT statement>')
}
RELATE [<case key>] TO [<foreign key>]
) AS [<nested table>]
La première ligne du code identifie la structure d'exploration de données à apprendre :
INSERT INTO MINING STRUCTURE [<mining structure name>]
Les lignes suivantes du code précisent les colonnes définies par la structure d'exploration de données. Vous devez répertorier chaque colonne dans la structure d'exploration de données et chaque colonne doit mapper une colonne figurant dans les données de la requête source. Vous pouvez utiliser la commande SKIP
pour ignorer les colonnes qui existent dans les données source, mais non dans la structure d'exploration de données. Pour plus d’informations sur l’utilisationSKIP
, consultez INSERT INTO (DMX).
(
<mining structure columns>
[<nested table>]
( SKIP, <skipped column> )
)
Les dernières lignes du code précisent les données à utiliser pour l'apprentissage de la structure d'exploration de données. Comme les données source figurent dans deux tables, vous allez faire appel à l'instruction SHAPE
pour relier les tables.
SHAPE {
OPENQUERY([<datasource>],'<SELECT statement>') }
APPEND
(
{OPENQUERY([<datasource>],''<nested SELECT statement>'')
}
RELATE [<case key>] TO [<foreign key>]
) AS [<nested table>]
Dans cette leçon, vous allez utiliser l'instruction OPENQUERY
pour définir les données sources. Pour plus d’informations sur les autres méthodes de définition d’une requête sur les données sources, consultez <Requête> de données sources.
Tâches de la leçon
Au cours de cette leçon, vous allez effectuer la tâche suivante :
- traiter la structure d'exploration de données Market Basket.
Traitement de la structure d'exploration de données Market Basket
Pour traiter la structure d'exploration de données à l'aide de l'instruction INSERT INTO
Dans Explorateur d'objets, cliquez avec le bouton droit sur le instance d’Analysis Services, pointez sur Nouvelle requête, puis cliquez sur DMX.
L'Éditeur de requête s'ouvre et contient une nouvelle requête vide.
Copiez l'exemple générique de l'instruction INSERT INTO dans la requête vide.
Remplacez le code suivant :
[<mining structure>]
par :
Market Basket
Remplacez le code suivant :
<mining structure columns> [<nested table>] ( SKIP, <skipped column> )
par :
[OrderNumber], [Products] (SKIP, [Model])
Dans l'instruction,
Products
fait référence à la table Products définie par l'instruction SHAPE.SKIP
est utilisé pour ignorer la colonne du modèle, qui existe dans les données sources comme clé, mais n'est pas utilisée par la structure d'exploration de données.Remplacez le code suivant :
SHAPE { OPENQUERY([<datasource>],'<SELECT statement>') } APPEND ( {OPENQUERY([<datasource>],'<nested SELECT statement>') } RELATE [<case key>] TO [<foreign key>] ) AS [<nested table>]
par :
SHAPE { OPENQUERY([Adventure Works DW],'SELECT OrderNumber FROM vAssocSeqOrders ORDER BY OrderNumber')} APPEND ( {OPENQUERY([Adventure Works DW],'SELECT OrderNumber, Model FROM dbo.vAssocSeqLineItems ORDER BY OrderNumber, Model') } RELATE OrderNumber to OrderNumber ) AS [Products]
La requête source fait référence à la source de données AdventureWorksDW2012 définie dans l’exemple de projet AdventureWorksDW2012 . Elle utilise la source de données pour accéder aux vues vAssocSeqLineItems et vAssocSeqOrders. Ces vues renferment les données source à utiliser pour effectuer l'apprentissage du modèle d'exploration de données. Si vous n’avez pas créé ce projet ou ces vues, consultez Tutoriel d’exploration de données de base.
Dans la commande
SHAPE
, vous allez utiliserOPENQUERY
pour définir deux requêtes. La première requête définit la table parente, la deuxième définit la table imbriquée. Les deux tables sont associées par le biais de la colonne OrderNumber présente dans les deux tables.L'instruction tout entière doit se présenter comme suit :
INSERT INTO MINING STRUCTURE [Market Basket] ( [OrderNumber],[Products] (SKIP, [Model]) ) SHAPE { OPENQUERY([Adventure Works DW],'SELECT OrderNumber FROM vAssocSeqOrders ORDER BY OrderNumber')} APPEND ( {OPENQUERY([Adventure Works DW],'SELECT OrderNumber, Model FROM dbo.vAssocSeqLineItems ORDER BY OrderNumber, Model') } RELATE OrderNumber to OrderNumber ) AS [Products]
Dans le menu Fichier , cliquez sur Enregistrer DMXQuery1.dmx sous.
Dans la boîte de dialogue Enregistrer sous , accédez au dossier approprié et nommez le fichier
Process Market Basket.dmx
.Dans la barre d’outils, cliquez sur le bouton Exécuter .
Après avoir terminé d'exécuter la requête, vous pouvez consulter les modèles et les jeux d'éléments trouvés, consulter les associations ou filtrer par jeu d'éléments, probabilité ou importance. Pour afficher ces informations, dans SQL Server Management Studio, cliquez avec le bouton droit sur le nom du modèle de données, puis cliquez sur Parcourir.
Dans la leçon suivante, vous allez créer plusieurs prédictions fondées sur les modèles d'exploration de données que vous avez ajoutés à la structure Market Basket.