Créer un rapport de validation croisée
S’applique à : SQL Server 2019 et versions antérieures d’Analysis Services Azure Analysis Services Fabric/Power BI Premium
Important
L’exploration de données a été déconseillée dans SQL Server 2017 Analysis Services et est à présent abandonnée dans SQL Server 2022 Analysis Services. La documentation n’est pas mise à jour pour les fonctionnalités déconseillées et abandonnées. Pour en savoir plus, consultez Compatibilité descendante d’Analysis Services.
Cette rubrique vous guide tout au long de la création d'un rapport de validation croisée à l'aide de l'onglet Graphique d'analyse de précision dans le Concepteur d'exploration de données. Pour obtenir des informations générales sur l’apparence d’un rapport de validation croisée et les mesures statistiques qu’il inclut, consultez Validation croisée (Analysis Services - Exploration de données).
Un rapport de validation croisée est fondamentalement différent d'un graphique d'analyse de précision, tel qu'un graphique de courbes d'élévation ou une matrice de classification.
La validation croisée évalue la distribution globale des données utilisées dans un modèle ou une structure ; par conséquent, vous ne spécifiez pas de jeu de données de test. La validation croisée utilise toujours uniquement les données d'origine exploitées pour l'apprentissage du modèle ou la structure d'exploration de données.
La validation croisée ne peut être exécutée que par rapport à des résultats prédictibles uniques. Si la structure prend en charge des modèles qui ont des attributs prédictibles différents, vous devez créer des rapports distincts pour chaque sortie prédictible.
Seuls les modèles ayant un rapport avec la structure actuellement sélectionnée sont disponibles pour la validation croisée.
Si la structure actuellement sélectionnée prend en charge une combinaison de modèles de clustering et d’autres modèles, quand vous cliquez sur Obtenir les résultats, la procédure stockée de validation croisée charge automatiquement les modèles qui ont la même colonne prédite et ignorent les modèles de clustering qui ne partagent pas le même attribut prédictible.
Vous pouvez créer un rapport de validation croisée sur un modèle de clustering qui n'a pas d'attribut prédictible uniquement si la structure d'exploration de données ne prend en charge aucun autre attribut prédictible.
Sélectionner une structure d'exploration de données
Ouvrez le Designer d’exploration de données dans SQL Server Data Tools.
Dans l'Explorateur de solutions, ouvrez la base de données qui contient la structure ou le modèle auquel est destiné le rapport que vous créez.
Double-cliquez sur la structure d'exploration de données pour ouvrir la structure et ses modèles associés dans le Concepteur d'exploration de données.
Cliquez sur l'onglet Graphique d'analyse de précision de l'exploration de données .
Cliquez sur l'onglet Validation croisée .
Définir les options de validation croisée
Sous l'onglet Validation croisée , pour Nombre de replis, cliquez sur la flèche vers le bas pour sélectionner un nombre entre 1 et 10. La valeur par défaut est 10.
Le Nombre de replis représente le nombre des partitions qui seront créées dans le jeu de données d'origine. Si vous définissez le Nombre de replis à 1, le jeu d'apprentissage est utilisé sans partitionnement.
Pour Attribut cible, cliquez sur la flèche vers le bas et sélectionnez une colonne dans la liste. Si le modèle est un modèle de clustering, sélectionnez #Cluster pour indiquer que le modèle n’a pas d’attribut prédictible. Notez que la valeur, #Cluster, est disponible uniquement quand la structure d’exploration de données ne prend pas en charge d’autres types d’attributs prédictibles.
Vous ne pouvez sélectionner qu'un seul attribut prédictible par rapport. Par défaut, tous les modèles connexes qui ont le même attribut prédictible sont inclus dans le rapport.
Pour Nombre maximal de cas, entrez un nombre qui est assez grand pour fournir un exemple représentatif de données lorsque les données sont fractionnées parmi le nombre spécifié de plis. Si le nombre est supérieur au nombre de cas dans le jeu d'apprentissage du modèle, tous les cas sont utilisés.
Si le jeu de données d'apprentissage est très important, la définition de la valeur de Nombre maximal de cas limite le nombre total de cas traités, et permet au rapport de se terminer plus vite. Cependant, vous ne devez pas définir une valeur trop basse pour Nombre maximal de cas au risque de manquer de données suffisantes pour la validation croisée.
Éventuellement, pour État cible, tapez la valeur de l'attribut prédictible que vous souhaitez modéliser. Par exemple, si la colonne (Bike Buyer) a deux valeurs possibles, 1 (Oui) et 2 (Non), vous pouvez entrer la valeur 1 pour évaluer la précision du modèle uniquement pour le résultat souhaité.
Notes
Si vous n'entrez pas de valeur, l'option Seuil cible n'est pas disponible, et le modèle est évalué pour toutes les valeurs possibles de l'attribut prédictible.
Éventuellement, pour Seuil cible, tapez un nombre décimal entre 0 et 1 pour spécifier la probabilité minimale nécessaire à une prédiction pour être comptabilisée comme exacte.
Pour obtenir des conseils supplémentaires sur la manière de définir des seuils de probabilité, consultez Mesures dans le rapport de validation croisée.
Cliquez sur Obtenir les résultats.
Imprimer le rapport de validation croisée
Cliquez avec le bouton droit sur le rapport complété sous l’onglet Validation croisée .
Dans le menu contextuel, cliquez sur Imprimer ou Aperçu avant impression pour afficher d'abord un aperçu du rapport.
Créer une copie du rapport dans Microsoft Excel
Cliquez avec le bouton droit sur le rapport complété sous l’onglet Validation croisée .
Dans le menu contextuel, cliquez sur Sélectionner tout.
Cliquez avec le bouton droit sur le texte sélectionné, puis sélectionnez Copier.
Collez la sélection dans un classeur Excel ouvert. Si vous utilisez l'option Coller , le rapport est collé dans Excel au format HTML, ce qui conserve la mise en forme des lignes et des colonnes. Si vous collez le rapport en utilisant les options Collage spécial pour le texte ou le texte Unicode, le rapport est collé au format séparé par des lignes.