Partager via


Modèles d'exploration de données (Analysis Services - Exploration de données)

Cette section explique l'architecture de base d'un modèle d'exploration de données, fournit une vue d'ensemble des propriétés d'un modèle d'exploration de données et décrit les manières dont pouvez créer un modèle d'exploration de données et l'utiliser.

Mining Model Architecture

Defining Mining Models

Mining Model Properties

Mining Model Columns

Processing Mining Models

Viewing and Querying Mining Models

Architecture du modèle d'exploration de données

Un modèle d'exploration de données récupère les données d'une structure d'exploration de données, puis les analyse à l'aide d'un algorithme d'exploration de données. Le modèle et la structure d'exploration de données sont des objets distincts. La structure d'exploration de données stocke les informations qui définissent la source de données. Un modèle d'exploration de données stocke les informations découlant du traitement statistique des données, telles que les motifs trouvés suite à l'analyse.

Un modèle d'exploration de données est vide jusqu'à ce que les données fournies par la structure d'exploration de données aient été traitées et analysées. Après traitement, un modèle d'exploration de données contiendra des métadonnées, des résultats et des liaisons se rapportant à la structure d'exploration de données.

Le modèle contient des métadonnées, des modèles et des liaisons

Les métadonnées indiquent le nom du modèle et le serveur où il est stocké, ainsi qu'une définition du modèle, y compris une liste des colonnes de la structure d'exploration de données utilisées pour créer le modèle, les définitions des filtres optionnels appliqués lors du traitement du modèle et l'algorithme utilisé pour analyser les données. Le choix des colonnes, des filtres et de l'algorithme a un impact important sur les résultats de l'analyse. Par exemple, si vous créez un modèle de clustering et un modèle d'arbre de décision avec les mêmes données, le contenu de ces modèles peut être très différent, car ils utilisent des algorithmes et des filtres différents. Pour plus d'informations, consultez Contenu du modèle d'exploration de données (Analysis Services - Exploration de données).

Les résultats stockés dans le modèle varient selon l'algorithme, mais ils peuvent inclure des motifs, des jeux d'éléments, des règles et des formules. Ces résultats peuvent être utilisés pour élaborer des prédictions.

Les liaisons stockées dans le modèle renvoient aux données mises en cache dans la structure d'exploration de données. Si les données ont été mises en cache dans la structure et n'ont pas été effacées après leur traitement, ces liaisons permettent d'extraire des résultats les cas les prenant en charge. Toutefois, les données réelles sont stockées dans le cache de la structure, et non dans le modèle.

[Haut de la page]

Définition des modèles d'exploration de données

Vous pouvez créer un modèle d'exploration de données en suivant les étapes ci-dessous :

  • Création de la structure d'exploration sous-jacente

  • Sélection d'un algorithme

  • Spécification des colonnes du modèle et de leur utilisation

  • Facultativement, définition des paramètres pour régler avec précision le traitement par l'algorithme

  • Traitement du modèle

Analysis Services fournit les outils suivants pour gérer les modèles d'exploration de données :

  • L'Assistant Exploration de données permet de créer une structure et un modèle d'exploration de données connexe. Il s'agit de la méthode la plus simple à utiliser. L'Assistant crée automatiquement la structure d'exploration de données requise et permet de configurer les paramètres importants.

  • Une instruction DMX CREATE MODEL peut être utilisée pour définir un modèle. La structure requise est créée automatiquement dans le cadre du processus ; par conséquent, vous ne pouvez pas réutiliser une structure existante avec cette méthode. Utilisez cette méthode si vous savez déjà exactement quel modèle vous souhaitez créer.

  • Une instruction A DMX ALTER STRUCTURE ADD MODEL peut être utilisée pour ajouter un nouveau modèle d'exploration de données à une structure existante. Utilisez cette méthode si vous souhaitez essayer différents modèles basés sur le même jeu de données.

Vous pouvez également créer par programmation des modèles d'exploration de données, avec AMO ou XML/A, ou en utilisant d'autres clients, tels que le Client d'exploration de données pour Excel. Pour plus d'informations, consultez les rubriques suivantes :

Objets AMO (Analysis Management Objects)

[Haut de la page]

Propriétés du modèle d'exploration de données

Chaque modèle d'exploration de données a des propriétés qui définissent le modèle et ses métadonnées. Celles-ci peuvent inclure le nom, la description, la date du dernier traitement du modèle, les autorisations liées au modèle, ainsi que tous les filtres appliqués aux données utilisées pour l'apprentissage.

Chaque modèle d'exploration de données possède également des propriétés découlant de la structure d'exploration de données qui décrivent les colonnes de données utilisées par le modèle. Si la colonne est une table imbriquée, il est également possible qu'un filtre séparé lui soit appliqué.

De plus, chaque modèle d'exploration de données contient deux propriétés spéciales : Algorithm et Usage.

  • **Propriété Algorithme   **Spécifie l'algorithme utilisé pour créer le modèle. Les algorithmes disponibles dépendent du fournisseur utilisé. Pour obtenir la liste des algorithmes inclus dans SQL ServerAnalysis Services, consultez Algorithmes d'exploration de données (Analysis Services – exploration de données). La propriété Algorithm s'applique au modèle d'exploration de données et ne peut être définie qu'une seule fois pour chaque modèle. Vous pouvez modifier l'algorithme ultérieurement mais certaines colonnes du modèle d'exploration de données peuvent devenir non valides si elles ne sont pas prises en charge par l'algorithme choisi. De plus, vous devez toujours réeffectuer le traitement du modèle en fonction des modifications.

  • **Propriété Usage   **Définit la façon dont chaque colonne est utilisée par le modèle. Vous pouvez définir l'utilisation de colonne sur Input, PredictPredict Only ou Key. La propriété Usage s'applique aux colonnes individuelles du modèle d'exploration de données et doit être définie individuellement pour chaque colonne incluse dans un modèle. Si la structure contient une colonne que vous n'utilisez pas dans le modèle, l'utilisation est définie sur Ignore.

Après avoir créé un modèle d'exploration de données, vous pouvez modifier la valeur de ses propriétés. Toutefois, toute modification, même sur le nom du modèle d'exploration de données, requiert un traitement supplémentaire du modèle. Lorsque le modèle a été traité de nouveau, vous pouvez voir des résultats différents.

[Haut de la page]

Colonnes d'un modèle d'exploration de données

À l'instar de la structure d'exploration de données, le modèle d'exploration de données contient des colonnes. Vous pouvez choisir les colonnes de la structure d'exploration de données à utiliser dans le modèle. Outre l'utilisation des colonnes figurant dans la structure d'exploration de données sous-jacente, vous pouvez créer des copies des colonnes de la structure d'exploration de données, puis les renommer ou modifier leur utilisation.

Selon l'algorithme choisi, il est possible que certaines colonnes de la structure d'exploration de données soient incompatibles avec le modèle, ou qu'elles mènent à des résultats incorrects. Vous devez examiner soigneusement les données de la structure et inclure dans le modèle uniquement les colonnes pertinentes pour l'analyse. Si vous pensez qu'une colonne ne doit pas être utilisée, il n'est pas nécessaire de la supprimer de la structure ou du modèle d'exploration de données ; à la place, vous pouvez placer sur cette colonne un indicateur qui spécifie qu'elle doit être ignorée lors de la génération du modèle. Cela implique que la colonne restera dans la structure d'exploration de données, mais qu'elle ne sera pas utilisée dans le modèle d'exploration de données ; toutefois, si l'extraction est activée depuis le modèle vers la structure d'exploration de données, vous pourrez récupérer les informations de cette colonne ultérieurement.

Après avoir créé le modèle, vous pouvez apporter des modifications, telles que l'ajout ou la suppression de colonnes, et la modification du nom du modèle. Toutefois, toute modification, même appliquée uniquement aux métadonnées du modèle, requiert un retraitement du modèle.

Pour plus d'informations, consultez Colonnes de structure d'exploration de données et Colonnes d'un modèle d'exploration de données.

[Haut de la page]

Traitement des modèles d'exploration de données

Un modèle d'exploration de données est un objet vide tant qu'il n'est pas traité. Lorsque vous traitez un modèle, les données mises en cache par la structure passent dans un filtre (s'il a été défini dans le modèle), puis elles sont analysées par l'algorithme. L'algorithme identifie les règles et les motifs figurant dans les données et les utilise ensuite pour remplir le modèle. Pour plus d'informations sur l'utilisation des algorithmes pour créer des modèles d'exploration de données, consultez Algorithmes d'exploration de données (Analysis Services – exploration de données).

Après son traitement, le modèle d'exploration de données stocke également des informations sur les résultats de l'analyse. Pour plus d'informations sur le type de données stocké dans un modèle d'exploration de données, consultez Contenu du modèle d'exploration de données (Analysis Services - Exploration de données).

[Haut de la page]

Affichage et interrogation des modèles d'exploration de données

Lorsque vous avez traité un modèle, vous pouvez l'explorer en utilisant les visionneuses personnalisées fournies dans Business Intelligence Development Studio et SQL Server Management Studio. Pour plus d'informations sur les visionneuses personnalisées dans Analysis Services, consultez Affichage d'un modèle d'exploration de données.

Vous pouvez également créer des requêtes sur le modèle d'exploration de données pour élaborer des prédictions, ou extraire les métadonnées du modèle ou les motifs créés par celui-ci. Vous pouvez créer des requêtes avec les extensions DMX (Data Mining Extensions). Pour plus d'informations sur les différents types de requête que vous pouvez utiliser sur un modèle d'exploration de données, consultez Interrogation de modèles d'exploration de données (Analysis Services - Exploration de données).