Article
03/31/2012

Personnalisation d'un modèle d'exploration de données (Analysis Services - Exploration de données)

Après avoir sélectionné un algorithme qui répond aux besoins de votre entreprise, vous pouvez personnaliser le modèle d'exploration de données de plusieurs façons pour éventuellement améliorer les résultats.

Utilisez des colonnes de données différentes du modèle, ou modifiez l'utilisation ou les types de contenu des colonnes.
Créez des filtres sur le modèle d'exploration de données pour limiter les données utilisées dans l'apprentissage du modèle.
Définissez les paramètres d'algorithme pour contrôler les seuils, les divisions des arbres et d'autres conditions.
Changez l'algorithme par défaut utilisé pour analyser les données ou effectuer des prédictions.

Modification des données utilisées par le modèle

Les décisions que vous prenez concernant les colonnes de données à utiliser dans le modèle et la façon d'utiliser et de traiter ces données peuvent considérablement affecter les résultats de l'analyse. Les rubriques suivantes fournissent des informations vous permettant de comprendre ces choix.

Modèles d'exploration de données (Analysis Services - Exploration de données)

Fournit une vue d'ensemble de l'architecture d'un modèle d'exploration de données, y compris la structure d'exploration de données sous-jacente et le choix de colonnes d'exploration de données.
Création de filtres pour les modèles d'exploration de données (Analysis Services - Exploration de données)

Explique comment vous pouvez créer des filtres qui s'appliquent à un modèle d'exploration de données, afin de créer des modèles basés sur un sous-ensemble des données de la structure d'exploration de données.
Sélection des fonctionnalités pour l'exploration de données.

Explique comment Analysis Services utilise un processus appelé sélection des fonctionnalités pour sélectionner uniquement les attributs les plus utiles pour l'ajout à un modèle. Le fait de réduire le nombre de colonnes et d'attributs peut améliorer les performances et la qualité du modèle. Les méthodes de sélection de fonctionnalités qui sont disponibles diffèrent en fonction de l'algorithme que vous choisissez.

Si vous utilisez l'Assistant Exploration de données, Analysis Services peut également sélectionner automatiquement les données qui sont les plus utiles pour générer un modèle particulier.

Personnalisation de paramètres d'algorithme

Le choix de l'algorithme détermine le type de résultats que vous obtiendrez. Pour obtenir des informations générales sur le fonctionnement d'un algorithme spécifique, ou sur les scénarios professionnels où l'utilisation d'un algorithme particulier vous serait profitable, consultez Algorithmes d'exploration de données (Analysis Services – exploration de données).

Les algorithmes d'exploration de données fournis dans Analysis Services sont également largement personnalisables. Vous pouvez contrôler le comportement de l'algorithme et la façon dont il traite des données en définissant des paramètres d'algorithme. Les rubriques suivantes fournissent des informations détaillées sur les paramètres pris en charge par chaque algorithme.

Références techniques relatives à l'algorithme MDT (Microsoft Decision Trees)

Références techniques relatives à l'algorithme de gestion de clusters Microsoft

Références techniques relatives à l'algorithme MNB (Microsoft Naive Bayes)

Références techniques relatives à l'algorithme Microsoft Association

Références techniques relatives à l'algorithme Microsoft Sequence Clustering (Analysis Services - Exploration de données)

Références techniques relatives à l'algorithme MNN (Microsoft Neural Network)

Références techniques relatives à l'algorithme MLR (Microsoft Logistic Regression)

Références techniques relatives à l'algorithme MLR (Microsoft Linear Regression)

Références techniques relatives à l'algorithme MTS (Microsoft Time Series)

La rubrique relative à chaque type d'algorithme répertorie également les fonctions de prédiction qui peuvent être utilisées avec les modèles basés sur cet algorithme.

Liste des paramètres d'algorithme

Chaque algorithme prend en charge des paramètres que vous pouvez utiliser pour personnaliser le comportement de l'algorithme et optimiser les résultats de votre modèle. Pour obtenir une description de l'utilisation de chaque paramètre, consultez les rubriques suivantes :

Nom de la propriété	S'applique à
AUTO_DETECT_PERIODICITY	Références techniques relatives à l'algorithme MTS (Microsoft Time Series)
CLUSTER_COUNT	Références techniques relatives à l'algorithme de gestion de clusters Microsoft Références techniques relatives à l'algorithme Microsoft Sequence Clustering (Analysis Services - Exploration de données)
CLUSTER_SEED	Références techniques relatives à l'algorithme de gestion de clusters Microsoft
CLUSTERING_METHOD	Références techniques relatives à l'algorithme de gestion de clusters Microsoft
COMPLEXITY_PENALTY	Références techniques relatives à l'algorithme MDT (Microsoft Decision Trees) Références techniques relatives à l'algorithme MTS (Microsoft Time Series)
FORCE_REGRESSOR	Références techniques relatives à l'algorithme MDT (Microsoft Decision Trees) Références techniques relatives à l'algorithme MLR (Microsoft Linear Regression) Indicateurs de modélisation (Exploration de données)
FORECAST_METHOD	Références techniques relatives à l'algorithme MTS (Microsoft Time Series)
HIDDEN_NODE_RATIO	Références techniques relatives à l'algorithme MNN (Microsoft Neural Network)
HISTORIC_MODEL_COUNT	Références techniques relatives à l'algorithme MTS (Microsoft Time Series)
HISTORICAL_MODEL_GAP	Références techniques relatives à l'algorithme MTS (Microsoft Time Series)
HOLDOUT_PERCENTAGE	Références techniques relatives à l'algorithme MLR (Microsoft Logistic Regression) Références techniques relatives à l'algorithme MNN (Microsoft Neural Network) Remarque Ce paramètre est différent de la valeur de pourcentage d'exclusion qui s'applique à une structure d'exploration de données.
HOLDOUT_SEED	Références techniques relatives à l'algorithme MLR (Microsoft Logistic Regression) Références techniques relatives à l'algorithme MNN (Microsoft Neural Network) Remarque Ce paramètre est différent de la valeur de départ d'exclusion qui s'applique à une structure d'exploration de données.
INSTABILITY_SENSITIVITY	Références techniques relatives à l'algorithme MTS (Microsoft Time Series)
MAXIMUM_INPUT_ATTRIBUTES	Références techniques relatives à l'algorithme de gestion de clusters Microsoft Références techniques relatives à l'algorithme MDT (Microsoft Decision Trees) Références techniques relatives à l'algorithme MLR (Microsoft Linear Regression) Références techniques relatives à l'algorithme MNB (Microsoft Naive Bayes) Références techniques relatives à l'algorithme MNN (Microsoft Neural Network) Références techniques relatives à l'algorithme MLR (Microsoft Logistic Regression)
MAXIMUM_ITEMSET_COUNT	Références techniques relatives à l'algorithme Microsoft Association
MAXIMUM_ITEMSET_SIZE	Références techniques relatives à l'algorithme Microsoft Association
MAXIMUM_OUTPUT_ATTRIBUTES	Références techniques relatives à l'algorithme MDT (Microsoft Decision Trees) Références techniques relatives à l'algorithme MLR (Microsoft Linear Regression) Références techniques relatives à l'algorithme MLR (Microsoft Logistic Regression) Références techniques relatives à l'algorithme MNB (Microsoft Naive Bayes) Références techniques relatives à l'algorithme MNN (Microsoft Neural Network)
MAXIMUM_SEQUENCE_STATES	Références techniques relatives à l'algorithme Microsoft Sequence Clustering (Analysis Services - Exploration de données)
MAXIMUM_SERIES_VALUE	Références techniques relatives à l'algorithme MTS (Microsoft Time Series)
MAXIMUM_STATES	Références techniques relatives à l'algorithme de gestion de clusters Microsoft Références techniques relatives à l'algorithme MNN (Microsoft Neural Network) Références techniques relatives à l'algorithme Microsoft Sequence Clustering (Analysis Services - Exploration de données)
MAXIMUM_SUPPORT	Références techniques relatives à l'algorithme Microsoft Association
MINIMUM_IMPORTANCE	Références techniques relatives à l'algorithme Microsoft Association
MINIMUM_ITEMSET_SIZE	Références techniques relatives à l'algorithme Microsoft Association
MINIMUM_DEPENDENCY_PROBABILITY	Références techniques relatives à l'algorithme MNB (Microsoft Naive Bayes)
MINIMUM_PROBABILITY	Références techniques relatives à l'algorithme Microsoft Association
MINIMUM_SERIES_VALUE	Références techniques relatives à l'algorithme MTS (Microsoft Time Series)
MINIMUM_SUPPORT	Références techniques relatives à l'algorithme Microsoft Association Références techniques relatives à l'algorithme de gestion de clusters Microsoft Références techniques relatives à l'algorithme MDT (Microsoft Decision Trees) Références techniques relatives à l'algorithme Microsoft Sequence Clustering (Analysis Services - Exploration de données) Références techniques relatives à l'algorithme MTS (Microsoft Time Series)
MISSING_VALUE_SUBSTITUTION	Références techniques relatives à l'algorithme MTS (Microsoft Time Series)
MODELLING_CARDINALITY	Références techniques relatives à l'algorithme de gestion de clusters Microsoft
PERIODICITY_HINT	Références techniques relatives à l'algorithme MTS (Microsoft Time Series)
PREDICTION_SMOOTHING	Références techniques relatives à l'algorithme MTS (Microsoft Time Series)
SAMPLE_SIZE	Références techniques relatives à l'algorithme de gestion de clusters Microsoft Références techniques relatives à l'algorithme MLR (Microsoft Logistic Regression) Références techniques relatives à l'algorithme MNN (Microsoft Neural Network)
SCORE_METHOD	Références techniques relatives à l'algorithme MDT (Microsoft Decision Trees)
SPLIT_METHOD	Références techniques relatives à l'algorithme MDT (Microsoft Decision Trees)
STOPPING_TOLERANCE	Références techniques relatives à l'algorithme de gestion de clusters Microsoft

Autres conditions requises

Le choix et la préparation des données est une partie importante du processus d'exploration de données. Par exemple, les algorithmes fournis par Microsoft n'autorisent pas les clés dupliquées. Le type des données qui est requis pour chaque modèle diffère en fonction de l'algorithme. Pour plus d'informations, consultez la section relative aux spécifications des rubriques suivantes :

Algorithme MDT (Microsoft Decision Trees)	Algorithme MTS (Microsoft Time Series)
Algorithme de gestion de clusters Microsoft	Algorithme MNN (Microsoft Neural Network) (Analysis Services - Exploration de données)
Algorithme MNB (Microsoft Naive Bayes)	Algorithme MLR (Microsoft Logistic Regression)
Algorithme Microsoft Association	Algorithme MLR (Microsoft Linear Regression)
Algorithme MSC (Microsoft Sequence Clustering)

Personnalisation des résultats à l'aide de requêtes et de fonctions de prédiction

Une fois que le modèle a été créé et traité, vous pouvez afficher les informations à l'aide de l'une des visionneuses spécifiques à chaque type de modèle. Vous pouvez également écrire des requêtes personnalisées en utilisant la syntaxe DMX (Data Mining Extensions) pour obtenir des informations plus techniques ou plus détaillées sur les modèles trouvés dans les données.

Pour plus d'informations sur la création de requêtes qui retournent le contenu du modèle, consultez Interrogation de modèles d'exploration de données (Analysis Services - Exploration de données).

Vous pouvez utiliser des fonctions pour étendre les résultats retournés par un modèle d'exploration de données. Certaines fonctions retournent également des statistiques qui représentent la probabilité d'un résultat, ou d'autres scores. En outre, les algorithmes individuels prennent également en charge des fonctions supplémentaires. Par exemple, si un modèle d'exploration de données utilise le clustering, vous pouvez utiliser des fonctions spéciales pour rechercher des informations relatives aux clusters. Toutefois, si votre modèle est basé sur l'algorithme MTS (Microsoft Time Series), un ensemble de fonctions différent est disponible pour effectuer des prédictions et interroger le contenu du modèle. Pour plus d'informations, consultez la rubrique de références techniques de chaque algorithme.

Pour obtenir des exemples illustrant l'interrogation d'un modèle d'exploration de données et l'utilisation des fonctions de prédiction conçues pour des types de modèles spécifiques, consultez Interrogation de modèles d'exploration de données (Analysis Services - Exploration de données).

Pour obtenir la liste des fonctions de prédiction prises en charge pour tous les types d'algorithmes, consultez Mappage des fonctions sur les type de requêtes (DMX).

Évaluation des modifications dans un modèle

Lorsque vous testez des modèles différents pour résoudre un problème commercial ou créez des variations sur un modèle, vous devez mesurer l'exactitude de chaque modèle et également évaluer comment chaque modèle répond à ce problème commercial. Pour obtenir des informations générales sur l'évaluation de modèles d'exploration de données, consultez Validation des modèles d'exploration de données (Analysis Services - Exploration de données). Pour plus d'informations sur la représentation graphique de l'exactitude de différents modèles d'exploration de données, consultezOutils de création de diagramme de précision de modèle (Analysis Services - Exploration de données).

Voir aussi

Concepts

Algorithmes d'exploration de données (Analysis Services – exploration de données)

Architecture physique (Analysis Services - Exploration de données)

Partager via