Partager via


Exploration du modèle de centre d'appels (Didacticiel sur l'exploration de données intermédiaire)

Maintenant que vous avez créé le modèle exploratoire, vous pouvez l’utiliser pour en savoir plus sur vos données à l’aide des outils suivants fournis dans SQL Server Data Tools (SSDT).

Visionneuse de l'algorithme MNN (Microsoft Neural Network)

La visionneuse comporte trois volets : Entrée, Sortie et Variables.

En utilisant le volet Sortie , vous pouvez sélectionner différentes valeurs pour l’attribut prédictible ou la variable dépendante. Si votre modèle contient plusieurs attributs prédictibles, vous pouvez sélectionner l’attribut dans la liste Attributs de sortie.

Le volet Variables compare les deux résultats que vous avez choisis en termes d’attributs contributeurs ou de variables. Les barres de couleur représentent visuellement dans quelle mesure la variable affecte les résultats cibles. Vous pouvez également afficher les variables sous forme de scores de finesse. Un score de finesse est calculé différemment en fonction du type de modèle d'exploration de données utilisé, mais il indique généralement l'amélioration apportée au modèle lorsque cet attribut est utilisé pour la prédiction.

Le volet Entrée vous permet d’ajouter des influenceurs au modèle pour tester différents scénarios de simulation.

Utilisation du volet Sortie

Dans ce modèle initial, vous voulez voir comment divers facteurs affectent le niveau de service. Pour ce faire, vous pouvez sélectionner Niveau de service dans la liste des attributs de sortie, puis comparer différents niveaux de service en sélectionnant des plages dans les listes déroulantes pour la valeur 1 et la valeur 2.

Pour comparer les niveaux de service les plus bas et les plus élevés
  1. Pour la valeur 1, sélectionnez la plage avec les valeurs les plus basses. Par exemple, la plage 0-0-0.7 représente les taux d'abandon les plus bas, et par conséquent le meilleur niveau de service.

    Remarque

    Les valeurs exactes de cette plage peuvent varier en fonction de la façon dont vous avez configuré le modèle.

  2. Pour la valeur 2, sélectionnez la plage avec les valeurs les plus élevées. Par exemple, la plage avec la valeur >=0,12 représente les taux d’abandon les plus élevés, et par conséquent le niveau de service le plus mauvais. En d'autres termes, 12 % des clients qui ont téléphoné pendant le temps de travail de cette équipe ont raccroché avant de parler à un commercial.

    Le contenu du volet Variables est mis à jour pour comparer les attributs qui contribuent aux valeurs de résultat. Par conséquent, la colonne de gauche vous montre les attributs associés au meilleur niveau de service, et la colonne de droite vous montre ceux associés au niveau de service le moins bon.

Utilisation du volet Variables

Dans ce modèle, il semble qu’il Average Time Per Issue s’agit d’un facteur important. Cette variable indique la durée moyenne nécessaire pour répondre à un appel, quel que soit le type d'appel.

Pour afficher et copier la probabilité et les scores de finesse pour un attribut
  1. Dans le volet Variables , placez la souris sur la barre colorée dans la première ligne.

    Cette barre colorée vous montre comment contribue fortement Average Time Per Issue à la qualité de service. L'info-bulle affiche un score global, des probabilités et des scores de finesse pour chaque combinaison d'une variable et d'un résultat cible.

  2. Dans le volet Variables, cliquez avec le bouton droit sur n’importe quelle barre colorée, puis sélectionnez Copier.

  3. Dans une feuille de calcul Excel, cliquez avec le bouton droit sur n’importe quelle cellule, puis sélectionnez Coller.

    Le rapport est collé sous forme de table HTML et affiche uniquement les scores correspondant à chaque barre.

  4. Dans une autre feuille de calcul Excel, cliquez avec le bouton droit sur n’importe quelle cellule, puis sélectionnez Coller spécial.

    Le rapport est collé au format texte et inclut les statistiques associées décrites dans la section suivante.

Utilisation du volet Entrée

Supposons que vous souhaitiez examiner l'incidence d'un facteur spécifique, tel que l'équipe ou le nombre d'opérateurs. Vous pouvez sélectionner une variable particulière à l’aide du volet Entrée et le volet Variables est automatiquement mis à jour pour comparer les deux groupes précédemment sélectionnés en fonction de la variable spécifiée.

Pour passer en revue l'incidence de la modification des attributs d'entrée sur le niveau de service
  1. Dans le volet Entrée, pour l’attribut, sélectionnez Maj.

  2. Pour Valeur, sélectionnez AM.

    Le volet Variables est mis à jour pour afficher l’impact sur le modèle lorsque le décalage est AM. Toutes les autres sélections restent identiques : vous comparez toujours les notes de service les plus basses et les plus élevées.

  3. Pour Valeur, sélectionnez PM1.

    Le volet Variables est mis à jour pour afficher l’impact sur le modèle lorsque le décalage change.

  4. Dans le volet Entrée , cliquez sur la ligne vide suivante sous Attribut, puis sélectionnez Appels. Pour Valeur, sélectionnez la plage qui indique le plus grand nombre d’appels.

    Une nouvelle condition d'entrée est ajoutée à la liste. Le volet Variables est mis à jour pour afficher l’impact sur le modèle pour un décalage particulier lorsque le volume d’appels est le plus élevé.

  5. Continuez à modifier les valeurs de Shift (Équipe) et de Calls (Appels) afin de rechercher les corrélations intéressantes entre l'équipe, le volume d'appels et le niveau de service.

    Remarque

    Pour effacer le volet Entrée afin de pouvoir utiliser différents attributs, cliquez sur Actualiser le contenu de la visionneuse.

Interprétation des statistiques fournies dans la visionneuse

Des temps d'attente plus longs sont un prédicteur fort d'un taux d'abandon élevé, ce qui correspond à un niveau de service médiocre. Cela peut sembler être une conclusion évidente ; toutefois, le modèle d'exploration de données vous fournit des données statistiques supplémentaires afin de vous aider à interpréter ces tendances.

  • Score : valeur qui indique l’importance globale de cette variable pour la discrimination entre les résultats. Plus le score est élevé, plus l'incidence de la variable sur le résultat est importante.

  • Probabilité de valeur 1 : pourcentage qui représente la probabilité de cette valeur pour ce résultat.

  • Probabilité de valeur 2 : pourcentage qui représente la probabilité de cette valeur pour ce résultat.

  • Lift for Value 1 et Lift for Value 2 : scores qui représentent l’impact de l’utilisation de cette variable particulière pour prédire les résultats Valeur 1 et Valeur 2. Plus le score est élevé, plus la variable est appropriée pour prédire les résultats.

Le tableau suivant contient des exemples de valeurs pour les principaux facteurs d'influence. Par exemple, la probabilité de la valeur 1 est de 60,6 % et la probabilité de la valeur 2 est de 8,30 %, ce qui signifie que lorsque la durée moyenne par problème était comprise entre 44 et 70 minutes, 60,6 % des cas étaient dans le décalage avec les notes de service les plus élevées (valeur 1) et 8,30 % des cas étaient dans le décalage avec les notes de service les plus mauvaises (valeur 2).

Vous pouvez tirer des conclusions de cette information. Un temps de réponse aux appels plus court (plage 44-70) contribue fortement à un meilleur niveau de service (plage 0.00-0.07). Le score (92.35) vous indique que cette variable est très importante.

Toutefois, lorsque vous parcourez la liste des facteurs contributeurs, vous voyez d'autres facteurs dont les effets sont plus subtils et plus difficiles à interpréter. Par exemple, l'équipe semble avoir une influence sur le service, mais les scores de finesse et les probabilités relatives indiquent que l'équipe n'est pas un facteur majeur.

Attribut Valeur < Favorise 0.07 Faveurs >= 0,12
Average Time Per Issue 89.087 - 120.000 Score : 100

Probabilité de valeur1 : 4,45 %

Probabilité de valeur2 : 51,94 %

Finesse pour Value1 : 0.19

Lift pour valeur2 : 1,94
Average Time Per Issue 44.000 - 70.597 Score : 92.35

Probabilité de Value1 : 60.06 %

Probabilité de Value2 : 8,30 %

Finesse pour Value1 : 2.61

Finesse pour Value2 : 0.31

Retour au début

Visionneuse de l’arborescence de contenu générique Microsoft

Cette visionneuse peut être utilisée pour afficher des informations encore plus détaillées créées par l'algorithme lors du traitement du modèle. MicrosoftGeneric Content Tree Viewer représente le modèle d’exploration de données sous la forme d’une série de nœuds, où chaque nœud représente des connaissances apprises sur les données d’apprentissage. Cette visionneuse peut être utilisée avec tous les modèles, mais le contenu des nœuds est différent en fonction du type de modèle.

Pour les modèles de réseau neuronal ou les modèles de régression logistique, vous pouvez rechercher le nœud des statistiques marginales (marginal statistics node), qui est particulièrement utile. Ce nœud contient des statistiques dérivées sur la distribution des valeurs dans vos données. Ces informations peuvent être utiles si vous voulez obtenir un résumé des données sans avoir à écrire de nombreuses requêtes T-SQL. Le graphique des valeurs de placement dans un conteneur dans la rubrique précédente a été dérivé du nœud des statistiques marginales.

Pour obtenir un résumé des valeurs de données à partir du modèle d'exploration de données

  1. Dans le Concepteur d’exploration de données, sous l’onglet Visionneuse du modèle d’exploration de données, sélectionnez <le nom> du modèle d’exploration de données.

  2. Dans la liste Visionneuse , sélectionnez Visionneuse d’arborescence de contenu générique Microsoft.

    La vue du modèle d'exploration de données est actualisée pour afficher une hiérarchie de nœuds dans le volet gauche et une table HTML dans le volet droit.

  3. Dans le volet Légende du nœud, cliquez sur le nœud qui porte le nom 1000000000000000000000000.

    Le nœud de niveau supérieur de tout modèle est toujours le nœud racine du modèle. Dans un modèle de réseau neuronal ou de régression logistique, le nœud situé immédiatement sous ce nœud est le nœud des statistiques marginales.

  4. Dans le volet Détails du nœud, faites défiler jusqu’à ce que vous trouviez la ligne, NODE_DISTRIBUTION.

  5. Faites défiler la table NODE_DISTRIBUTION vers le bas pour afficher la distribution des valeurs calculée par l’algorithme de réseau neuronal.

Pour utiliser ces données dans un rapport, vous pouvez sélectionner puis copier les informations correspondant à des lignes spécifiques, ou utiliser la requête DMX (Data Mining Extensions) suivante pour extraire le contenu complet du nœud.

SELECT *   
FROM [Call Center EQ4].CONTENT  
WHERE NODE_NAME = '10000000000000000'  

Vous pouvez également utiliser la hiérarchie de nœuds et les détails de la table NODE_DISTRIBUTION pour parcourir des chemins d'accès individuels dans le réseau neuronal et afficher des statistiques provenant de la couche masquée. Pour plus d’informations, consultez Exemples de requête de modèle de réseau neuronal.

Retour au début

Tâche suivante de la leçon

Ajout d’un modèle de régression logistique à la structure du centre d’appels (didacticiel sur l’exploration de données intermédiaire)

Voir aussi

Contenu du modèle d’exploration de données pour les modèles de réseau neuronal (Analysis Services - Exploration de données)
Exemples de requêtes de modèle de réseau neuronal
Informations techniques de référence sur l’algorithme MNN (Microsoft Neural Network)
Modifier la discrétisation d’une colonne dans un modèle d’exploration de données