Partager via


Outils d’exploration de données

Microsoft SQL Server Analysis Services fournit les outils suivants que vous pouvez utiliser pour créer des solutions d’exploration de données :

  • L’Assistant Exploration de données dans SQL Server Data Tools (SSDT) facilite la création de structures d’exploration de données et de modèles d’exploration de données, à l’aide de sources de données relationnelles ou de données multidimensionnelles dans des cubes.

    Dans l'Assistant, choisissez les données à utiliser, puis appliquez des techniques spécifiques d'exploration de données, telles que le clustering, les réseaux neuronaux ou la modélisation de série chronologique.

  • Les visionneuses de modèles sont fournies dans SQL Server Management Studio et SQL Server Data Tools (SSDT) pour explorer vos modèles d’exploration de données après leur création. Vous pouvez parcourir des modèles à l'aide de visionneuses adaptées à chaque algorithme, ou approfondir l'analyse à l'aide de la visionneuse de contenu du modèle.

  • Le Générateur de requêtes de prédiction est fourni dans SQL Server Management Studio et SQL Server Data Tools (SSDT) pour vous aider à créer des requêtes de prédiction. Vous pouvez également tester la précision des modèles sur un jeu de données d'exclusion ou des données externes, ou utiliser la validation croisée pour évaluer la qualité de votre ensemble de données.

  • SQL Server Management Studio est l’interface où vous gérez les solutions d’exploration de données existantes qui ont été déployées sur une instance d’Analysis Services. Vous pouvez retraiter des structures et des modèles pour mettre à jour les données qu'ils contiennent.

  • SQL Server Integration Services contient des outils que vous pouvez utiliser pour nettoyer les données, pour automatiser des tâches telles que la création de prédictions et la mise à jour de modèles, et pour créer des solutions d’exploration de texte.

Les sections suivantes fournissent plus d’informations sur les outils d’exploration de données dans SQL Server.

Assistant Exploration de données

Utilisez l'Assistant Exploration de données pour commencer la création de solutions d'exploration de données. Cet Assistant est facile et rapide à utiliser, et vous guide tout au long du processus de création d'une structure d'exploration de données et d'un modèle d'exploration de données initial qui lui est associé ; il inclut les tâches de sélection d'un type d'algorithme et d'une source de données, ainsi que la définition des données de cas utilisées pour l'analyse.

Pour plus d’informations : Assistant Exploration de données (Analysis Services - Exploration de données)

Concepteur d’exploration de données

Une fois que vous avez créé une structure d’exploration de données et un modèle d’exploration de données à l’aide de l’Assistant Exploration de données, vous pouvez utiliser le Concepteur d’exploration de données à partir de SQL Server Data Tools (SSDT) ou de SQL Server Management Studio pour travailler avec des modèles et des structures existants.

Le concepteur contient des outils permettant de réaliser ces tâches :

  • Modifier les propriétés des structures d'exploration de données, ajouter des colonnes et créer des alias de colonne, modifier la méthode de placement dans un conteneur ou la distribution attendue des valeurs.

  • Ajouter de nouveaux modèles à une structure existante ; copier les modèles, modifier les propriétés de modèle ou les métadonnées, ou définir des filtres sur un modèle d'exploration de données.

  • Parcourir des schémas et des règles dans le modèle ; explorer les associations ou les arbres de décision. Obtenir des statistiques détaillées

    Les visionneuses personnalisées sont fournies pour chaque heure différente du modèle, afin de vous aider à analyser vos données et à explorer les schémas indiqués par l'exploration de données.

  • Valider les modèles en créant des graphiques de courbes d'élévation ou en analysant la courbe de bénéfices concernant les modèles. Comparer des modèles à l'aide de matrices de classification, ou valider un ensemble de données et ses modèles à l'aide de la validation croisée.

  • Créer des prédictions et des requêtes de contenu sur des modèles d'exploration de données existants. Générer des requêtes uniques ou configurer des requêtes afin de générer des prédictions pour des tables entières de données externes.

Pour plus d’informations : Concepteur d’exploration de données

SQL Server Management Studio

Après avoir créé et déployé des modèles d’exploration de données sur un serveur, vous pouvez utiliser SQL Server Management Studio pour gérer la base de données Analysis Services qui héberge les objets d’exploration de données. Vous pouvez également continuer à exécuter des tâches qui utilisent le modèle, telles que l'exploration des modèles, le traitement de nouvelles données et la création de prédictions.

Management Studio contient également des éditeurs de requête que vous pouvez utiliser pour concevoir et exécuter des requêtes DMX (Data Mining Extensions), ou utiliser des objets d’exploration de données à l’aide de XMLA.

Tâches et transformations d'exploration de données d'Integration Services

SQL Server Integration Services fournit de nombreux composants qui prennent en charge l’exploration de données.

Certains outils d’Integration Services sont conçus pour automatiser les tâches courantes d’exploration de données, notamment la prédiction, la génération de modèles et le traitement. Par exemple :

  • Créer un package Integration Services qui met automatiquement à jour le modèle chaque fois que le jeu de données est mis à jour avec de nouveaux clients

  • Exécutez la segmentation ou l'échantillonnage personnalisé des enregistrements de cas.

  • Générez automatiquement des modèles transmis aux paramètres.

Toutefois, vous pouvez également utiliser l'exploration de données dans un flux de travail de package, en tant qu'entrée à d'autres processus. Par exemple :

  • Utilisez les valeurs de probabilité générées par le modèle pour pondérer les scores pour l'exploration de texte ou d'autres tâches de classification.

  • Générez automatiquement des prédictions basées sur des données antérieures et utilisez ces valeurs pour évaluer la validité de nouvelles données.

  • Utilisation de la régression logistique pour segmenter les clients entrants par risque.

Pour plus d’informations : Projets connexes pour les solutions d’exploration de données

Voir aussi

Informations de référence sur les extensions d’exploration de données (DMX)
Tâches et procédures des modèles d’exploration de données
Tâches et procédures de la visionneuse de modèle d’exploration de données
Solutions d’exploration de données