Création de prédictions pour les modèles de centre d'appels (Didacticiel sur l'exploration de données intermédiaire)
Maintenant que vous en savez plus sur les interactions entre les équipes, le nombre d'opérateurs, les appels et le niveau de service, vous êtes prêt à créer des requêtes de prédiction qui peuvent être utilisées dans l'analyse commerciale et la planification. Vous allez d'abord créer des prédictions sur le modèle exploratoire afin de tester des hypothèses. Ensuite, vous créerez des prédictions en bloc à l'aide du modèle de régression logistique.
Cette leçon suppose que vous soyez déjà au fait du concept des requêtes de prédiction.
Création de prédictions à l'aide du modèle de réseau neuronal
L'exemple suivant montre comment élaborer une prédiction singleton à l'aide du modèle de réseau neuronal créé pour l'exploration. Les prédictions singleton représentent une méthode efficace pour essayer des valeurs différentes afin de voir l'effet dans le modèle. Dans ce scénario, vous allez prédire le niveau de service de l'équipe de nuit (midnight) (sans spécification d'un jour de la semaine) si six opérateurs expérimentés sont de service.
Pour créer une requête singleton à l'aide du modèle de réseau neuronal
Dans Outils de données SQL Server (SSDT), ouvrez la solution qui contient le modèle à utiliser.
Dans le Concepteur d'exploration de données, cliquez sur l'onglet Prédiction de modèle d'exploration de données.
Cliquez sur Sélectionner un modèle dans le volet Modèle d'exploration de données.
La boîte de dialogue Sélectionnez un modèle d'exploration de données présente une liste de structures d'exploration de données. Développez la structure d'exploration de données pour afficher la liste des modèles d'exploration de données qui lui sont associés.
Développez la structure d'exploration de données Call Center Default et sélectionnez le modèle de réseau neuronal, Call Center - LR.
Dans le menu Modèle d'exploration de données, sélectionnez Requête singleton.
La boîte de dialogue Entrée de requête singleton s'affiche, avec les colonnes mappées aux colonnes du modèle d'exploration de données.
Dans la boîte de dialogue Entrée de requête singleton, cliquez sur Shift, puis sélectionnez midnight.
Cliquez sur Lvl 2 Operators, puis tapez 6.
Dans la moitié inférieure de l'onglet Prédiction de modèle d'exploration de données, cliquez sur la première ligne de la grille.
Dans la colonne Source, cliquez sur la flèche vers le bas, puis sélectionnez Fonction de prévision. Dans la colonne Champ, sélectionnez PredictHistogram.
La liste des arguments que vous pouvez utiliser avec cette fonction de prévision apparaît automatiquement dans la zone Critères/Argument.
Faites glisser la colonne ServiceGrade de la liste de colonnes du volet Modèle d'exploration de données vers la zone Critères/Argument.
Le nom de la colonne est automatiquement inséré comme argument. Vous pouvez choisir n'importe quelle colonne d'attribut prédictible et la faire glisser vers cette zone de texte.
Cliquez sur le bouton Basculer vers l'affichage du résultat de la requête dans l'angle supérieur du Générateur de requêtes de prédiction.
Les résultats attendus contiennent les valeurs prédites possibles pour chaque niveau de service donné en fonction de ces entrées, ainsi que les valeurs de support et de probabilité pour chaque prédiction. Vous pouvez repasser en mode Conception à tout moment pour modifier les entrées ou en ajouter.
Création de prédictions à l'aide d'un modèle de régression logistique
Si vous connaissez déjà les attributs qui sont pertinents pour le problème de l'entreprise, vous pouvez utiliser un modèle de régression logistique pour prédire l'effet de la modification de certains attributs. La régression logistique est une méthode statistique couramment utilisée pour effectuer des prévisions en fonction des modifications apportées à des variables indépendantes. On l'utilise par exemple dans le calcul de scores financiers ou pour prédire le comportement des clients en fonction de données démographiques.
Au cours de cette tâche, vous allez apprendre à créer une source de données qui sera utilisée pour des prédictions, puis à élaborer des prédictions afin de répondre à plusieurs questions pratiques.
Génération des données utilisées pour la prédiction en bloc
Il existe de nombreuses façons de fournir des données d'entrée : vous pouvez par exemple importer des niveaux d'affectation de personnel à partir d'une feuille de calcul et soumettre ces données au modèle pour prédire la qualité de service pour le mois suivant.
Dans cette leçon, vous allez utiliser la vue de source de données pour créer une requête nommée. Cette requête nommée est une instruction Transact-SQL personnalisée qui, pour chaque équipe de travail, calcule le nombre maximal d'opérateurs du personnel, le nombre minimal d'appel reçu et le nombre moyen de problèmes générés. Vous joindrez ensuite ces données à un modèle d'exploration de données pour faire des prédictions sur une série de dates à venir.
Pour générer des données d'entrée pour une requête de prédiction en bloc
Dans l'Explorateur de solutions, cliquez avec le bouton droit sur Vues des sources de données, puis sélectionnez Nouvelle vue de source de données.
Dans l'Assistant Vue de source de données, sélectionnez Adventure Works DW Multidimensional 2012 comme source de données, puis cliquez sur Suivant.
Dans la page Sélectionner des tables et des vues, cliquez sur Suivant sans sélectionner de tables.
Dans la page Fin de l'Assistant, tapez le nom Shifts (Équipes).
Ce nom apparaîtra dans l'Explorateur de solutions comme nom de la vue de source de données.
Cliquez avec le bouton droit sur le volet de conception vide, puis sélectionnez Nouvelle requête nommée.
Dans la boîte de dialogue Créer une requête nommée, tapez Shifts for Call Center (Équipes du centre d'appels) comme valeur pour Nom.
Ce nom apparaîtra dans le Concepteur de vue de source de données uniquement comme nom de la requête nommée.
Collez l'instruction de requête suivante dans le volet de texte SQL situé dans la moitié inférieure de la boîte de dialogue.
SELECT DISTINCT WageType, Shift, AVG(Orders) as AvgOrders, MIN(Orders) as MinOrders, MAX(Orders) as MaxOrders, AVG(Calls) as AvgCalls, MIN(Calls) as MinCalls, MAX(Calls) as MaxCalls, AVG(LevelTwoOperators) as AvgOperators, MIN(LevelTwoOperators) as MinOperators, MAX(LevelTwoOperators) as MaxOperators, AVG(IssuesRaised) as AvgIssues, MIN(IssuesRaised) as MinIssues, MAX(IssuesRaised) as MaxIssues FROM dbo.FactCallCenter GROUP BY Shift, WageType
Dans le volet de conception, cliquez avec le bouton droit sur la table Shifts for Call Center, puis sélectionnez Explorer les données pour afficher un aperçu des données telles qu'elles sont retournées par la requête T-SQL.
Cliquez avec le bouton droit sur l'onglet Shifts.dsv (Design), puis cliquez sur Enregistrer pour enregistrer la définition de la nouvelle vue de source de données.
Prédiction de mesures de niveau de service pour chaque équipe
Maintenant que vous avez généré des valeurs pour chaque équipe, vous allez utiliser ces valeurs comme entrée pour le modèle de régression logistique que vous avez créé, afin de générer des prédictions à utiliser dans la planification des entreprises.
Pour utiliser la nouvelle vue de source de données comme entrée pour une requête de prédiction
Dans le Concepteur d'exploration de données, cliquez sur l'onglet Prédiction de modèle d'exploration de données.
Dans le volet Modèle d'exploration de données, cliquez sur Sélectionner un modèle, puis choisissez Call Center - LR dans la liste des modèles disponibles.
Dans le menu Modèle d'exploration de données, désactivez l'option Requête singleton. Un avertissement vous indique que les entrées de requête singleton seront perdues. Cliquez sur OK.
La boîte de dialogue Entrée de requête singleton est remplacée par la boîte de dialogue Sélectionner une ou plusieurs tables d'entrée.
Cliquez sur Sélectionner la table de cas.
Dans la boîte de dialogue Sélectionner une table, sélectionnez Shifts dans la liste des sources de données. Dans la liste Nom de la table/vue, sélectionnez Shifts for Call Center (il est possible que cet élément soit sélectionné automatiquement), puis cliquez sur OK.
L'aire de conception Prédiction de modèle d'exploration de données est mise à jour pour afficher les mappages créés en fonction des noms et des types de données des colonnes des données d'entrée et du modèle.
Cliquez avec le bouton droit sur l'une des lignes de jointure, puis sélectionnez Modifier les connexions.
Dans cette boîte de dialogue, vous pouvez voir exactement les colonnes qui sont mappées et celles qui ne le sont pas. Le modèle d'exploration de données contient des colonnes pour Calls, Orders, IssuesRaised et LvlTwoOperators, que vous pouvez mapper à n'importe lequel des agrégats que vous avez créés en fonction de ces colonnes dans les données sources. Dans ce scénario, vous allez effectuer un mappage aux moyennes.
Cliquez sur la cellule vide en regard de LevelTwoOperators, puis sélectionnez Shifts for Call Center.AvgOperators.
Cliquez sur la cellule vide en regard de Calls, puis sélectionnez Shifts for Call Center.AvgCalls. Puis cliquez sur OK.
Pour créer les prédictions pour chaque équipe
Dans la grille affichée dans la moitié inférieure du Générateur de requêtes de prédiction, cliquez sur la cellule vide sous Source, puis sélectionnez Shifts for Call Center.
Dans la cellule vide sous Champ, sélectionnez Shift.
Cliquez sur la ligne vide suivante dans la grille, et répétez la procédure décrite ci-dessus pour ajouter une autre ligne pour WageType.
Cliquez sur la ligne vide suivante dans la grille. Dans la colonne Source, sélectionnez Fonction de prédiction. Dans la colonne Champ, sélectionnez Prédire.
Faites glisser la colonne ServiceGrade du volet Modèle d'exploration de données vers le bas jusqu'à la grille, puis vers la cellule Critères/Argument. Dans le champ Alias, tapez Predicted Service Grade (Niveau de service prédit).
Cliquez sur la ligne vide suivante dans la grille. Dans la colonne Source, sélectionnez Fonction de prédiction. Dans la colonne Champ, sélectionnez PredictProbability.
Faites glisser la colonne ServiceGrade du volet Modèle d'exploration de données vers le bas jusqu'à la grille, puis vers la cellule Critères/Argument. Dans le champ Alias, tapez Probability (Probabilité).
Cliquez sur Basculer vers l'affichage du résultat de la requête pour visualiser les prédictions.
Le tableau suivant montre des exemples de résultats pour chaque équipe.
Shift |
WageType |
Niveau de service (Service Grade) prédit |
Probabilité |
---|---|---|---|
AM |
holiday |
0.165 |
0.377520666 |
midnight |
holiday |
0.105 |
0.364105573 |
PM1 |
holiday |
0.165 |
0.40056055 |
PM2 |
holiday |
0.165 |
0.338532973 |
AM |
weekday |
0.165 |
0.370847617 |
midnight |
weekday |
0.08 |
0.352999173 |
PM1 |
weekday |
0.165 |
0.317419177 |
PM2 |
weekday |
0.105 |
0.311672027 |
Prédiction de l'effet de temps de réponse réduit sur Service Grade
Vous avez généré des valeurs moyennes pour chaque équipe et utilisé ces valeurs comme entrée pour le modèle de régression logistique. Toutefois, étant donné que l'objectif de l'entreprise est de maintenir le taux d'abandon dans la plage 0.00-0.05, les résultats ne sont pas encourageants.
Par conséquent, en se basant sur le modèle d'origine, qui montrait une forte influence du temps de réponse sur le niveau de service, l'équipe Opérations décide d'exécuter des prédictions pour évaluer si la réduction du temps moyen de réponse aux appels peut améliorer la qualité du service. Par exemple, que se passerait-il pour les valeurs de niveau de service si le temps de réponse aux appels était réduit à 90 % ou même à 80 % du temps de réponse actuel ?
Il est facile de créer une vue de source de données qui calcule les temps de réponse moyens pour chaque équipe et d'ajouter ensuite des colonnes qui calculent 80 % ou 90 % du temps de réponse moyen. Vous pouvez ensuite utiliser la vue de source de données comme entrée pour le modèle.
Bien que les étapes exactes ne sont pas affichées ici, le tableau suivant compare les effets sur le niveau de service lorsque vous réduisez les temps de réponse à 80 % ou 90 % des temps de réponse actuels.
D'après ces résultats, vous pouvez conclure que, sur les équipes ciblées, que vous devez réduire le temps de réponse à 90 % du taux actuel afin d'améliorer la qualité de service.
Équipe, salaire et jour |
Qualité prédite du service avec le temps de réponse moyen actuel |
Qualité prédite du service à 90 pour cent de réduction du temps de réponse |
Qualité prédite du service à 80 pour cent de réduction du temps de réponse |
---|---|---|---|
Congé AM |
0.165 |
0.05 |
0.05 |
Congé PM1 |
0.05 |
0.05 |
0.05 |
Congé Minuit |
0.165 |
0.05 |
0.05 |
Vous pouvez créer diverses autres requêtes de prédiction sur ce modèle. Par exemple, vous pouvez prédire le nombre d'opérateurs requis pour satisfaire un certain niveau de service ou répondre à un certain nombre d'appels entrants. Étant donné que vous pouvez inclure plusieurs sorties dans un modèle de régression logistique, il est facile de faire des essais avec différentes variables indépendantes et sorties sans qu'il soit nécessaire de créer de nombreux modèles distincts.
Notes
Les compléments d'exploration de données pour Excel 2007 fournissent des Assistants de régression logistique qui permettent de répondre facilement à des questions complexes, telles que le nombre d'opérateurs de niveau 2 qui seraient nécessaires pour améliorer le niveau de service afin d'atteindre un niveau cible pour une équipe spécifique. Les compléments d'exploration de données, qui peuvent être téléchargés gratuitement, incluent des Assistants basés sur l'algorithme MNN (Microsoft Neural Network) ou l'algorithme MLR (Microsoft Logistic Regression). Pour plus d'informations, consultez les liens suivants :
Compléments d'exploration de données SQL Server 2005 pour Office 2007 : Analyse de scénarios de valeurs cibles et de scénarios divers
Compléments d'exploration de données SQL Server 2008 pour Office 2007 : Analyse de scénarios de valeurs cibles, analyse de scénarios divers et calcul de prédiction
Conclusion
Vous avez appris à créer, à personnaliser et à interpréter des modèles d'exploration de données basés sur l'algorithme MNN (Microsoft Neural Network) et sur l'algorithme MLR (Microsoft Logistic Regression). Ces types de modèles élaborés permettent une diversité presque infinie d'analyses ; ils peuvent, par conséquent, être complexes et difficiles à maîtriser.
Toutefois, ces algorithmes peuvent s'itérer par le biais de plusieurs combinaisons de facteurs et identifier automatiquement les corrélations les plus fortes en fournissant la prise en charge statistique des analyses qui seraient très difficiles à identifier par l'exploration manuelle des données à l'aide de Transact-SQL ou même de PowerPivot.
Voir aussi
Concepts
Exemples de requêtes de modèle de régression logistique
Algorithme MLR (Microsoft Logistic Regression)