Assistant Exploration de données
L'Assistant Exploration de données inclus dans Microsoft SQL Server 2005 Analysis Services (SSAS) démarre chaque fois que vous ajoutez une nouvelle structure d'exploration de données dans un projet d'exploration de données. L'assistant définit les nouvelles structures ainsi que le modèle d'exploration de données initial pour chaque structure. La structure du modèle initial, y compris les tables et les colonnes, est dérivée d'une vue de source de données ou d'un cube existant.
L'Assistant Exploration de données vous permet d'effectuer les tâches suivantes :
- spécifier s'il convient de créer la structure et les modèles d'exploration de données à partir d'une base de données relationnelle ou à partir d'un cube existant, issu d'une base de données OLAP ;
- spécifier l'algorithme à utiliser pour la création du modèle initial ;
- spécifier la vue de source de données ou la dimension de cube qui contient les données d'apprentissage sur lesquelles créer le modèle ;
- définir le jeu de cas en spécifiant une table de cas et des tables imbriquées à partir d'une source de données relationnelles, ou les colonnes de clé de cas et de niveau de cas à partir d'une source de données OLAP ;
- définir l'utilisation des colonnes dans le jeu de cas ;
- détecter automatiquement et définir les types de contenus et de données des colonnes ;
- trancher le cube, si votre modèle d'exploration de données se base sur une source de données OLAP ;
- nommer la nouvelle structure d'exploration de données et le modèle d'exploration de données initial ;
- créer une nouvelle dimension d'exploration de données, si votre modèle d'exploration de données se base sur une source de données OLAP.
Lorsque vous avez terminé toutes les étapes de l'Assistant Exploration de données, vous utilisez le Concepteur d'exploration de données pour modifier la structure et les modèles d'exploration de données, ainsi que pour parcourir les modèles et les utiliser pour des prévisions.
Pour plus d'informations :Concepteur d'exploration de données
Utilisation de l'Assistant Exploration de données
Pour démarrer l'Assistant Exploration de données, ajoutez une nouvelle structure d'exploration de données dans un projet Analysis Services en utilisant l'Explorateur de solutions ou le menu Projet dans Business Intelligence Development Studio.
L'Assistant Exploration de données se compose de deux parties, une pour chaque type de source de données :
- Modèles d'exploration de données relationnels
- Modèles d'exploration de données OLAP
Modèles d'exploration de données relationnels
Lorsque vous créez un modèle d'exploration de données à partir d'une source de données relationnelles dans Analysis Services, vous commencez par spécifier dans l'Assistant Exploration de données que vous voulez utiliser une base de données relationnelle existante pour définir la structure du modèle. Ensuite, vous spécifiez la technique d'exploration de données à utiliser, en sélectionnant l'algorithme le plus approprié au type d'analyse d'exploration de données que vous voulez.
Pour plus d'informations :Algorithmes d'exploration de données
Spécification des types de vues de source de données et de tables
Les étapes suivantes de l'assistant consistent à sélectionner la vue de source de données spécifique à utiliser pour définir la structure d'exploration de données et pour spécifier une table de cas. La table de cas inclut les données d'apprentissage que vous utiliserez pour effectuer l'apprentissage du modèle d'exploration de données. Vous pouvez également spécifier les tables à imbriquer dans la table de cas, si plusieurs tables contiennent vos données.
Pour plus d'informations :Tables imbriquées
Spécification de l'utilisation des colonnes
Une fois que vous avez spécifié la table de cas et les tables imbriquées, vous devez déterminer le type d'utilisation de chaque colonne dans les tables à inclure dans la structure d'exploration de données. Si vous ne spécifiez pas de type d'utilisation pour une colonne, celle-ci ne sera pas incluse dans la structure d'exploration de données. Les colonnes d'exploration de données peuvent être de quatre types : colonne clé, colonne d'entrée, colonne prévisible ou une combinaison d'une colonne d'entrée et d'une colonne prévisible. Les colonnes clés contiennent un identificateur unique pour chaque ligne d'une table. Certains modèles d'exploration de données, tels que les modèles Sequence Clustering et Time Series, peuvent contenir plusieurs colonnes clés. Les colonnes d'entrée fournissent les informations à partir desquelles les prévisions sont effectuées. Les colonnes prévisibles contiennent les informations que vous tentez de prévoir dans le modèle d'exploration de données.
Par exemple, une série de tables peuvent contenir les ID des clients, des informations démographiques et la somme d'argent que chaque client dépense dans un magasin spécifique. L'ID de client identifie de manière unique le client et relie également la table de cas aux tables imbriquées, de sorte que vous pouvez l'utiliser comme colonne clé. Vous pouvez utiliser des colonnes sélectionnées à partir des informations démographiques comme colonnes d'entrée et la colonne qui indique la somme d'argent dépensée par chaque client comme colonne prévisible. Vous pouvez alors générer un modèle d'exploration de données qui relie les données démographiques à la somme d'argent dépensée par un client dans un magasin. Vous pouvez utiliser ce modèle comme base pour un marketing ciblé.
L'Assistant Exploration de données fournit la fonctionnalité Suggérer, qui est activée lorsque vous sélectionnez une colonne prévisible. Les jeux de données contiennent souvent plus de colonnes que vous voulez en utiliser pour générer un modèle d'exploration de données. La fonctionnalité Suggérer calcule un score compris entre 0 et 1, qui décrit la relation entre chaque colonne du jeu de données et la colonne prévisible. En fonction de ce score, la fonctionnalité suggère les colonnes à utiliser comme entrée pour le modèle d'exploration de données. Si vous utilisez la fonctionnalité Suggérer, vous pouvez utiliser les colonnes suggérées, modifier les choix pour les adapter à vos besoins ou ignorer les suggestions.
Spécification des types de contenus et de données
Une fois que vous avez sélectionné une ou plusieurs colonnes prévisibles et colonnes d'entrée, vous pouvez spécifier les types de contenu et de données pour chaque colonne.
Pour plus d'informations :Types de données (Exploration de données), Types de contenu (Exploration de données)
Fin de l'Assistant
La dernière étape de l'Assistant consiste à nommer la structure d'exploration de données et le modèle d'exploration de données associé. Si vous sélectionnez Accepter l'extraction, la fonctionnalité d'extraction est activée dans le modèle. Cela vous permet d'explorer les données sources utilisées pour générer le modèle.
Retour en haut
Modèles d'exploration de données OLAP
Lorsque vous générez un modèle d'exploration de données multidimensionnel à partir d'une source de données OLAP dans Analysis Services, vous commencez par spécifier dans l'Assistant Exploration de données que vous voulez utiliser un cube existant pour définir la structure du modèle. Ensuite, vous spécifiez la technique d'exploration de données à utiliser, en sélectionnant l'algorithme le plus approprié au type d'analyse d'exploration de données que vous voulez.
Pour plus d'informations :Algorithmes d'exploration de données
Spécification de la source de données et de la clé de cas
Ensuite, vous sélectionnez la dimension de cube à utiliser comme source de données pour définir la structure d'exploration de données. Vous sélectionnez alors un attribut à utiliser comme clé, ou clé de cas, du modèle d'exploration de données.
Remarque : |
---|
Le modèle d'exploration de données OLAP que vous générez et le cube source que vous utilisez pour créer le modèle doivent figurer dans la même base de données Analysis Services. |
Spécification des colonnes de niveau de cas et de l'utilisation des colonnes
Une fois que vous avez sélectionné une clé de cas, les attributs et les mesures associés à cette clé sont affichés dans une arborescence à la page suivante de l'Assistant. Dans cette liste, vous sélectionnez les attributs et les mesures à utiliser comme colonnes de la structure. Ces colonnes sont appelées colonnes de niveau de cas. Comme dans le cas d'un modèle relationnel, vous devez également spécifier la manière dont chaque colonne doit être utilisée dans la structure, ce que vous pouvez faire à la page suivante de l'Assistant. Les colonnes peuvent être des colonnes clé, d'entrée, prévisibles, d'entrée et prévisibles, ou non sélectionnées.
Ajout de tables imbriquées
La partie OLAP de l'Assistant Exploration de données inclut une option permettant d'ajouter des tables imbriquées dans la structure du modèle d'exploration de données. À la page Spécifier l'utilisation des colonnes du modèle d'exploration de données de l'Assistant, cliquez sur Ajouter des tables imbriquées pour afficher une boîte de dialogue distincte qui vous guidera dans la procédure permettant d'ajouter des tables imbriquées. Seuls les groupes de mesures qui s'appliquent à la dimension sont affichés. Sélectionnez un groupe de mesures qui contient la clé étrangère de la dimension de cas. Ensuite, spécifiez l'utilisation de chaque colonne du groupe de mesures, colonne d'entrée ou colonne prévisible. L'Assistant ajoute alors la table imbriquée à la table de cas. Le nom par défaut de la table imbriquée correspond au nom de la dimension imbriquée, mais vous pouvez renommer la table imbriquée et ses colonnes. Pour plus d'informations :Tables imbriquées
Spécification des types de contenus et de données
Une fois que vous avez sélectionné une ou plusieurs colonnes prévisibles et colonnes d'entrée, vous pouvez spécifier les types de contenu et de données pour chaque colonne.
Pour plus d'informations :Types de données (Exploration de données), Types de contenu (Exploration de données)
Découpage en tranches du cube source
Dans la partie OLAP de l'Assistant, vous pouvez limiter la portée de votre modèle d'exploration de données en découpant en tranches le cube source avant d'effectuer l'apprentissage du modèle d'exploration de données. Le découpage du cube est similaire à l'ajout d'une clause WHERE dans une instruction SQL. Par exemple, si un cube contient des informations sur l'achat de produits, vous pouvez limiter un attribut d'âge à plus de 30, une colonne de genre à féminin uniquement et une date d'achat à après mars 2000. De cette manière, vous pouvez limiter le modèle à une femme de plus de 30 ans qui a acheté un produit après mars 2000.
Fin de l'Assistant
La dernière étape de l'Assistant consiste à nommer la structure d'exploration de données et le modèle d'exploration de données associé. Si vous sélectionnez Accepter l'extraction, la fonctionnalité d'extraction est activée dans le modèle. Cela vous permet d'explorer les données sources utilisées pour générer le modèle. Vous pouvez aussi spécifier, en fonction du modèle d'exploration de données, si vous voulez ajouter une nouvelle dimension au cube source ou créer un nouveau cube à partir du modèle d'exploration de données.
Retour en haut
Voir aussi
Concepts
Création d'une nouvelle structure d'exploration de données
Gestion des modèles d'exploration de données dans le Concepteur d'exploration de données
Concepts d'exploration de données
Utilisation des outils d'exploration de données
Utilisation de l'exploration de données
Autres ressources
Rubriques Procédure : onglet Structure d'exploration de données