Ajout d'une vue de source de données pour les données de centre d'appels (Didacticiel sur l'exploration de données intermédiaire)
Au cours de cette tâche, vous allez ajouter une vue de source de données qui sera utilisée pour accéder aux données d'un centre d'appels. Les mêmes données seront utilisées pour générer aussi bien le modèle de réseau neuronal initial destiné à l'exploration que le modèle de régression logistique que vous utiliserez pour faire des recommandations.
Vous utiliserez également le concepteur de vue de source de données pour ajouter une colonne pour le jour de la semaine. En effet, bien que les données sources suivent les données de centre d'appels par date, votre expérience indique qu'il existe des modèles récurrents à la fois en termes de volume d'appel et de qualité de service, selon que le jour est un week-end ou un jour de semaine.
Procédures
Pour ajouter une vue de source de données
Dans l'Explorateur de solutions, cliquez avec le bouton droit sur Vues des sources de données et sélectionnez Nouvelle vue de source de données.
L'Assistant Vue de source de données s'ouvre.
Dans la page Assistant Vue de source de données, cliquez sur Suivant.
Dans la page Sélectionner une source de données, sous Sources de données relationnelles, sélectionnez la source de données Adventure Works DW Multidimensional 2012 . Si vous ne disposez pas de cette source de données, consultez Didacticiel sur l'exploration de données de base. Cliquez sur Suivant.
Dans la page Sélectionner des tables et des vues, sélectionnez la table suivante, puis cliquez sur la flèche vers la droite pour l'ajouter à la vue de source de données :
FactCallCenter (dbo)
DimDate
Cliquez sur Suivant.
Dans la page Fin de l'Assistant, la vue de source de données par défaut est nommée Adventure Works DW Multidimensional 2012 . Remplacez ce nom par CallCenter, puis cliquez sur Terminer.
Le Concepteur de vue de source de données s'ouvre pour afficher la vue de source de données CallCenter.
Cliquez avec le bouton droit dans le volet Vue de source de données et sélectionnez Ajouter/supprimer des tables. Sélectionnez la table, DimDate et cliquez sur OK.
Une relation doit être ajoutée automatiquement entre les colonnes DateKey de chaque table. Vous allez utiliser cette relation pour obtenir la colonne EnglishDayNameOfWeek à partir de la table DimDate et l'utiliser dans votre modèle.
Dans le Concepteur de vue de source de données, cliquez avec le bouton droit sur la table FactCallCenter, puis sélectionnez Nouveau calcul nommé.
Dans la boîte de dialogue Créer un calcul nommé, tapez les valeurs suivantes :
Nom de colonne
DayOfWeek
Description
Obtenir le jour de la semaine depuis la table DimDate
Expression
(SELECT EnglishDayNameOfWeek AS DayOfWeek FROM DimDate where FactCallCenter.DateKey = DimDate.DateKey)
Pour vérifier que l'expression crée les données dont vous avez besoin, cliquez avec le bouton droit sur la table FactCallCenter, puis sélectionnez Explorer les données.
Prenez une minute pour examiner les données disponibles afin de pouvoir comprendre comment elles sont utilisées dans l'exploration de données :
Nom de colonne |
Contient |
---|---|
FactCallCenterID |
Clé arbitraire créée lorsque les données ont été importées vers l'entrepôt de données. Cette colonne identifie les enregistrements uniques et doit être utilisée comme clé de cas du modèle d'exploration de données. |
DateKey |
Date de fonctionnement du centre d'appels, sous la forme d'un entier. Les clés de date entières sont souvent utilisées dans les entrepôts de données, mais vous souhaitez peut-être obtenir la date au format date/heure si vous vouliez fonctionner par groupements de valeurs de date. Notez que les dates ne sont pas uniques car le fournisseur fournit un rapport distinct pour chaque équipe et pour chaque jour de fonctionnement. |
WageType |
Indique si le jour était un jour de semaine, de week-end ou un jour férié. Il est possible qu'il existe une différence de qualité de service client le week-end par rapport aux jours de semaine. Vous utiliserez donc cette colonne comme entrée. |
Shift |
Indique l'équipe pour laquelle les appels sont enregistrés. Ce centre d'appels divise la journée de travail en quatre équipes : AM, PM1, PM2 et Midnight. Il est possible que les horaires des équipes influencent la qualité du service client. Vous utiliserez donc cela comme entrée. |
LevelOneOperators |
Indique le nombre d'opérateurs de niveau 1 qui sont en service. Les employés de centre d'appels débutent au niveau 1. Ces employés ont donc moins d'expérience. |
LevelTwoOperators |
Indique le nombre d'opérateurs de niveau 2 qui sont en service. Un employé doit enregistrer un certain nombre d'heures de service pour obtenir la qualification d'opérateur de niveau 2. |
TotalOperators |
Nombre total d'opérateurs présents pendant le temps de travail de l'équipe. |
Calls |
Nombre d'appels reçus pendant la période de travail de l'équipe. |
AutomaticResponses |
Nombre d'appels qui ont été totalement gérés par traitement automatisé des appels (réponse vocale interactive). |
Orders |
Nombre de commandes qui ont fait suite à des appels. |
IssuesRaised |
Nombre de problèmes, générés par des appels, qui requièrent un suivi. |
AverageTimePerIssue |
Durée moyenne requise pour répondre à un appel entrant. |
ServiceGrade |
Mesure qui indique la qualité générale du service, mesuré sous la forme de taux d'abandon de l'équipe entière. Plus le taux d'abandon est élevé, plus la probabilité que les clients soient mécontents et que des commandes potentielles soient perdues est forte. |
Notez que les données comprennent quatre colonnes différentes basées sur une seule colonne de date : WageType, DayOfWeek, Shift et DateKey. D'ordinaire, dans l'exploration de données il n'est pas judicieux d'utiliser plusieurs colonnes dérivées des mêmes données, car les valeurs se mettent trop lourdement en corrélation entre elles et peuvent masquer d'autres modèles.
Toutefois, nous n'utiliserons pas DateKey dans le modèle car il contient trop de valeurs uniques. Il n'existe aucune relation directe entre Shift et DayOfWeek, et WageType et DayOfWeek sont uniquement liées en partie. Si vous vous inquiétiez de la collinéarité, vous pouvez créer la structure à l'aide de toutes les colonnes disponibles, puis ignorer d'autres colonnes dans chaque modèle et tester l'effet.
Tâche suivante de la leçon
Voir aussi
Concepts
Vues de sources de données dans les modèles multidimensionnels