Personnalisation d'un modèle d'exploration de données (Analysis Services - Exploration de données)
Après avoir sélectionné un algorithme qui répond aux besoins de votre entreprise, vous pouvez personnaliser le modèle d'exploration de données de plusieurs façons pour éventuellement améliorer les résultats.
Utilisez des colonnes de données différentes du modèle, ou modifiez l'utilisation ou les types de contenu des colonnes.
Créez des filtres sur le modèle d'exploration de données pour limiter les données utilisées dans l'apprentissage du modèle.
Définissez les paramètres d'algorithme pour contrôler les seuils, les divisions des arbres et d'autres conditions.
Changez l'algorithme par défaut utilisé pour analyser les données ou effectuer des prédictions.
Modification des données utilisées par le modèle
Les décisions que vous prenez concernant les colonnes de données à utiliser dans le modèle et la façon d'utiliser et de traiter ces données peuvent considérablement affecter les résultats de l'analyse. Les rubriques suivantes fournissent des informations vous permettant de comprendre ces choix.
Modèles d'exploration de données (Analysis Services - Exploration de données)
Fournit une vue d'ensemble de l'architecture d'un modèle d'exploration de données, y compris la structure d'exploration de données sous-jacente et le choix de colonnes d'exploration de données.
-
Explique comment vous pouvez créer des filtres qui s'appliquent à un modèle d'exploration de données, afin de créer des modèles basés sur un sous-ensemble des données de la structure d'exploration de données.
Sélection des fonctionnalités pour l'exploration de données.
Explique comment Analysis Services utilise un processus appelé sélection des fonctionnalités pour sélectionner uniquement les attributs les plus utiles pour l'ajout à un modèle. Le fait de réduire le nombre de colonnes et d'attributs peut améliorer les performances et la qualité du modèle. Les méthodes de sélection de fonctionnalités qui sont disponibles diffèrent en fonction de l'algorithme que vous choisissez.
Si vous utilisez l'Assistant Exploration de données, Analysis Services peut également sélectionner automatiquement les données qui sont les plus utiles pour générer un modèle particulier.
Personnalisation de paramètres d'algorithme
Le choix de l'algorithme détermine le type de résultats que vous obtiendrez. Pour obtenir des informations générales sur le fonctionnement d'un algorithme spécifique, ou sur les scénarios professionnels où l'utilisation d'un algorithme particulier vous serait profitable, consultez Algorithmes d'exploration de données (Analysis Services – exploration de données).
Les algorithmes d'exploration de données fournis dans Analysis Services sont également largement personnalisables. Vous pouvez contrôler le comportement de l'algorithme et la façon dont il traite des données en définissant des paramètres d'algorithme. Les rubriques suivantes fournissent des informations détaillées sur les paramètres pris en charge par chaque algorithme.
Références techniques relatives à l'algorithme MDT (Microsoft Decision Trees)
Références techniques relatives à l'algorithme Clusters Microsoft
Références techniques relatives à l'algorithme MNB (Microsoft Naive Bayes)
Références techniques relatives à l'algorithme Microsoft Association
Références techniques relatives à l'algorithme MSC (Microsoft Sequence Clustering)
Références techniques relatives à l'algorithme MNN (Microsoft Neural Network)
Références techniques relatives à l'algorithme MLR (Microsoft Logistic Regression)
Références techniques relatives à l'algorithme MLR (Microsoft Linear Regression)
Références techniques relatives à l'algorithme MTS (Microsoft Time Series)
La rubrique relative à chaque type d'algorithme répertorie également les fonctions de prédiction qui peuvent être utilisées avec les modèles basés sur cet algorithme.
Liste des paramètres d'algorithme
Chaque algorithme prend en charge des paramètres que vous pouvez utiliser pour personnaliser le comportement de l'algorithme et optimiser les résultats de votre modèle. Pour obtenir une description de l'utilisation de chaque paramètre, consultez les rubriques suivantes :
Autres conditions requises
Le choix et la préparation des données est une partie importante du processus d'exploration de données. Par exemple, les algorithmes fournis par Microsoft n'autorisent pas les clés dupliquées. Le type des données qui est requis pour chaque modèle diffère en fonction de l'algorithme. Pour plus d'informations, consultez la section relative aux spécifications des rubriques suivantes :
|
Personnalisation des résultats à l'aide de requêtes et de fonctions de prédiction
Une fois que le modèle a été créé et traité, vous pouvez afficher les informations à l'aide de l'une des visionneuses spécifiques à chaque type de modèle. Vous pouvez également écrire des requêtes personnalisées en utilisant la syntaxe DMX (Data Mining Extensions) pour obtenir des informations plus techniques ou plus détaillées sur les modèles trouvés dans les données.
Pour plus d'informations sur la création de requêtes qui retournent le contenu du modèle, consultez Interrogation de modèles d'exploration de données (Analysis Services - Exploration de données).
Vous pouvez utiliser des fonctions pour étendre les résultats retournés par un modèle d'exploration de données. Certaines fonctions retournent également des statistiques qui représentent la probabilité d'un résultat, ou d'autres scores. En outre, les algorithmes individuels prennent également en charge des fonctions supplémentaires. Par exemple, si un modèle d'exploration de données utilise le clustering, vous pouvez utiliser des fonctions spéciales pour rechercher des informations relatives aux clusters. Toutefois, si votre modèle est basé sur l'algorithme MTS (Microsoft Time Series), un ensemble de fonctions différent est disponible pour effectuer des prédictions et interroger le contenu du modèle. Pour plus d'informations, consultez la rubrique de références techniques de chaque algorithme.
Pour obtenir des exemples illustrant l'interrogation d'un modèle d'exploration de données et l'utilisation des fonctions de prédiction conçues pour des types de modèles spécifiques, consultez Interrogation de modèles d'exploration de données (Analysis Services - Exploration de données).
Pour obtenir la liste des fonctions de prédiction prises en charge pour tous les types d'algorithmes, consultez Mappage des fonctions sur les type de requêtes (DMX).
Évaluation des modifications dans un modèle
Lorsque vous testez des modèles différents pour résoudre un problème commercial ou créez des variations sur un modèle, vous devez mesurer l'exactitude de chaque modèle et également évaluer comment chaque modèle répond à ce problème commercial. Pour obtenir des informations générales sur l'évaluation de modèles d'exploration de données, consultez Validation des modèles d'exploration de données (Analysis Services - Exploration de données). Pour plus d'informations sur la représentation graphique de l'exactitude de différents modèles d'exploration de données, consultezOutils de création de diagramme de précision de modèle (Analysis Services - Exploration de données).