Mesures dans le rapport de validation croisée
Pendant la validation croisée, Analysis Services divise les données d’une structure d’exploration de données en plusieurs sections, puis teste de manière itérative la structure et les modèles d’exploration de données associés. D'après cette analyse, il produit un jeu de mesures de précision standard pour la structure et chaque modèle.
Le rapport contient certaines informations de base sur le nombre de replis dans les données et le volume de données dans chaque repli, ainsi qu'un ensemble de mesures générales qui décrivent la distribution des données. En comparant les mesures générales de chaque section croisée, vous pouvez évaluer la fiabilité de la structure ou du modèle.
Analysis Services affiche également un ensemble de mesures détaillées pour les modèles d’exploration de données. Ces mesures dépendent du type de modèle et du type d'attribut qui est analysé (discret ou continu, par exemple).
Cette section fournit une liste des mesures contenues dans le rapport de validation croisée , ainsi que leur signification. Pour plus d’informations sur la façon dont chaque mesure est calculée, consultez Formules de validation croisée.
Liste de mesures dans le rapport de validation croisée
Le tableau suivant répertorie les mesures qui apparaissent dans le rapport de validation croisée. Les mesures sont regroupées par type de test, fourni dans la colonne gauche du tableau suivant. La colonne de droite répertorie le nom de la mesure tel qu'il apparaît dans le rapport, et fournit une brève explication de sa signification.
type de test | Mesures et descriptions |
---|---|
Clustering | Mesures qui s’appliquent aux modèles clustering : Probabilité de cas : cette mesure indique généralement la probabilité qu’un cas appartienne à un cluster particulier. Pour la validation croisée, les scores sont additionnés, puis divisés par le nombre de cas ; ici, le score est une vraisemblance moyenne de cas. |
classification ; | Mesures qui s’appliquent aux modèles de classification : Vrai positif/ Vrai négatif/ Faux positif/ Faux positif : nombre de lignes ou de valeurs dans la partition où l’état prédit correspond à l’état cible et où la probabilité de prédiction est supérieure au seuil spécifié. Les cas qui ont des valeurs manquantes pour l’attribut cible sont exclus, ce qui signifie que le nombre de toutes les valeurs peut ne pas s’additionner |
Pass/Fail : nombre de lignes ou de valeurs dans la partition où l’état prédit correspond à l’état cible et où la valeur de probabilité de prédiction est supérieure à 0. | |
Vraisemblance | Les mesures de probabilité s’appliquent à plusieurs types de modèles : Lift : rapport entre la probabilité de prédiction réelle et la probabilité marginale dans les cas de test. Les lignes qui ont des valeurs manquantes pour l'attribut cible sont exclues. Cette mesure affiche généralement le degré d'amélioration de la probabilité des résultats cibles lorsque le modèle est utilisé. Erreur carrée moyenne racine : racine carrée de l’erreur moyenne pour tous les cas de partition, divisée par le nombre de cas dans la partition, à l’exclusion des lignes qui ont des valeurs manquantes pour l’attribut cible. RMSE est un estimateur souvent utilisé pour les modèles prévisionnels. Le score calcule la moyenne des résiduels pour chaque cas et génère un seul indicateur de l'erreur modèle. Score du journal : logarithme de la probabilité réelle pour chaque cas, additionnée, puis divisée par le nombre de lignes dans le jeu de données d’entrée, à l’exclusion des lignes qui ont des valeurs manquantes pour l’attribut cible. Étant donné que la probabilité est représentée comme une fraction décimale, les scores du journal sont toujours un nombre négatif. Un nombre plus proche de 0 représente un meilleur score. Alors que les scores bruts peuvent avoir des distributions très irrégulières ou asymétriques, un score de journal est semblable à un pourcentage. |
Estimation | Mesures qui s’appliquent uniquement aux modèles d’estimation, qui prédisent un attribut numérique continu : Erreur carrée moyenne racine : erreur moyenne lorsque la valeur prédite est comparée à la valeur réelle. RMSE est un estimateur souvent utilisé pour les modèles prévisionnels. Le score calcule la moyenne des résiduels pour chaque cas et génère un seul indicateur de l'erreur modèle. Erreur absolue moyenne : erreur moyenne lorsque des valeurs prédites sont comparées à des valeurs réelles, calculées comme la moyenne de la somme absolue des erreurs. L'erreur absolue moyenne est utile pour comprendre la justesse des prédictions par rapport aux valeurs réelles. Un faible score signifie que les prédictions étaient plus précises. Log Score : logarithme de la probabilité réelle pour chaque cas, additionnée, puis divisée par le nombre de lignes dans le jeu de données d’entrée, à l’exclusion des lignes qui ont des valeurs manquantes pour l’attribut cible. Étant donné que la probabilité est représentée comme une fraction décimale, les scores du journal sont toujours un nombre négatif. Un nombre plus proche de 0 représente un meilleur score. Alors que les scores bruts peuvent avoir des distributions très irrégulières ou asymétriques, un score de journal est semblable à un pourcentage. |
Agrégats | Les mesures d’agrégation fournissent une indication de la variance dans les résultats de chaque partition : Moyenne : moyenne des valeurs de partition d’une mesure particulière. Écart type : moyenne de l’écart par rapport à la moyenne d’une mesure spécifique, sur toutes les partitions d’un modèle. Pour la validation croisée, une valeur plus élevée pour ce score implique une variation substantielle entre les replis. |