Erstellen von Vorhersagen für Callcentermodelle (Data Mining-Lernprogramm für Fortgeschrittene)
Nachdem Sie Informationen zu Interaktionen zwischen Arbeitsschichten, der Anzahl der Telefonisten und Anrufe sowie der Dienstqualität gesammelt haben, können Sie einige Vorhersageabfragen für Geschäftsanalysen und Planungen erstellen. Sie erstellen zuerst einige Vorhersagen über das explorative Modell, um einige Annahmen zu testen. Danach erstellen Sie Massenvorhersagen mithilfe des logistischen Regressionsmodells.
Für diese Lektion wird davon ausgegangen, dass Sie bereits mit dem Konzept von Vorhersageabfragen vertraut sind.
Erstellen von Vorhersagen mit dem neuronalen Netzwerkmodell
Im folgenden Beispiel wird veranschaulicht, wie eine SINGLETON-Vorhersage mithilfe des neuronalen Netzwerkmodells getroffen wird, das für Untersuchungen erstellt wurde. Mit SINGLETON-Vorhersagen können verschiedene Werte und deren Auswirkungen auf das Modell auf einfache Weise getestet werden. In diesem Szenario werden Sie die Dienstqualität für die Nachtschicht (kein Wochentag angegeben) vorhersagen, wenn sechs erfahrene Telefonisten Dienst haben.
So erstellen Sie eine SINGLETON-Abfrage mithilfe des neuronalen Netzwerkmodells
Öffnen Sie in SQL Server-Datentools (SSDT) die Lösung, die das zu verwendende Modell enthält.
Klicken Sie im Data Mining-Designer auf die Registerkarte Miningmodellvorhersage.
Klicken Sie im Bereich Miningmodell auf Modell auswählen.
Im Dialogfeld Miningmodell auswählen wird eine Liste mit Miningstrukturen angezeigt. Erweitern Sie die Miningstruktur, um eine Liste der dieser Struktur zugeordneten Miningmodelle anzuzeigen.
Erweitern Sie die Miningstruktur Call Center Default, und wählen Sie das neuronale Netzwerkmodell Call Center - LR aus.
Klicken Sie im Menü Miningmodell auf SINGLETON-Abfrage.
Das Dialogfeld SINGLETON-Abfrageeingabe wird angezeigt, in dem die Spalten den Spalten im Miningmodell zugeordnet sind.
Klicken Sie im Dialogfeld SINGLETON-Abfrageeingabe auf die Zeile für Shift, und wählen Sie midnight aus.
Klicken Sie auf die Zeile für Lvl 2 Operators, und geben Sie 6 ein.
Klicken Sie in der unteren Hälfte der Registerkarte Miningmodellvorhersage auf die erste Zeile im Raster.
Klicken Sie in der Spalte Quelle auf den Pfeil nach unten, und wählen Sie Vorhersagefunktion aus. Wählen Sie in der Spalte Feld den Eintrag PredictHistogram aus.
Eine Liste mit Argumenten, die Sie mit dieser Vorhersagefunktion verwenden können, wird automatisch im Feld Kriterium/Argument angezeigt.
Ziehen Sie die Spalte ServiceGrade aus der Liste der Spalten im Bereich Miningmodell in das Feld Kriterium/Arguments.
Der Name der Spalte wird automatisch als Argument eingefügt. Sie können jede vorhersagbare Attributspalte in dieses Textfeld ziehen.
Klicken Sie oben im Generator für Vorhersageabfragen auf die Schaltfläche Zur Abfrageergebnissicht wechseln.
Die erwarteten Ergebnisse enthalten die möglichen vorhergesagten Werte für jede Dienstqualität bei Berücksichtigung der angegebenen Eingaben zusammen mit Unterstützungs- und Wahrscheinlichkeitswerten für jede Vorhersage. Sie können jederzeit zur Entwurfsansicht zurückkehren und die Eingaben ändern oder weitere Eingaben hinzufügen.
Erstellen von Vorhersagen mithilfe eines logistischen Regressionsmodells
Wenn Sie die Attribute bereits kennen, die für das Geschäftsproblem relevant sind, können Sie ein logistisches Regressionsmodell verwenden, um die Auswirkungen bei Änderungen an bestimmten unabhängigen Variablen vorherzusagen. Die logistische Regression ist eine statistische Methode, die häufig verwendet wird, um Vorhersagen auf Grundlage von Änderungen in unabhängigen Variablen abzugeben: Sie wird beispielsweise bei finanziellen Bewertungen verwendet, um das Kundenverhalten basierend auf demografischen Kundendaten vorherzusagen.
In dieser Aufgabe erfahren Sie, wie Sie eine Datenquelle für Vorhersagen erstellen und anschließend Vorhersagen zur Beantwortung verschiedener Geschäftsfragen treffen.
Generieren von Daten für Massenvorhersagen
Es gibt viele Möglichkeiten, Eingabedaten bereitzustellen: Sie können beispielsweise die Personalausstattung aus einer Tabelle importieren und diese Daten durch das Modell laufen lassen, um die Dienstqualität für den nächsten Monat vorherzusagen.
In diesem Lektion erstellen Sie mithilfe des Datenquellensicht-Designers eine benannte Abfrage. Diese benannte Abfrage ist eine benutzerdefinierte Transact-SQL-Anweisung, die für jede Schicht im Dienstplat die maximale Anzahl von Operatoren, die Mindestanzahl angenommener Anrufe und die durchschnittliche Anzahl generierter Fragen berechnet. Sie verknüpfen dann diese Daten mit einem Miningmodell, um Vorhersagen für eine Reihe bevorstehender Tage zu treffen.
So generieren Sie Eingabedaten für eine Massenvorhersageabfrage
Klicken Sie im Projektmappen-Explorer mit der rechten Maustaste auf Datenquellensichten, und wählen Sie dann Neue Datenquellensicht aus.
Wählen Sie im Datenquellensicht-Assistenten Adventure Works DW Multidimensional 2012 als Datenquelle aus und klicken Sie dann auf Weiter.
Klicken Sie auf der Seite Tabellen und Sichten auswählen auf Weiter, ohne eine Tabelle auszuwählen.
Geben Sie auf der Seite Assistenten abschließen den Namen "Schichten" ein.
Dieser Name wird im Projektmappen-Explorer als Name der Datenquellensicht angezeigt.
Klicken Sie mit der rechten Maustaste auf den leeren Entwurfsbereich, und wählen Sie Neue benannte Abfrage aus.
Geben Sie im Dialogfeld Benannte Abfrage erstellen unter Namen Shift "Schichten im Call Center" ein.
Dieser Name wird im Datenquellensicht-Designer nur als der Name der benannten Abfrage angezeigt.
Fügen Sie in der unteren Hälfte des Dialogfelds die folgende Abfrageanweisung in den SQL-Textbereich ein.
SELECT DISTINCT WageType, Shift, AVG(Orders) as AvgOrders, MIN(Orders) as MinOrders, MAX(Orders) as MaxOrders, AVG(Calls) as AvgCalls, MIN(Calls) as MinCalls, MAX(Calls) as MaxCalls, AVG(LevelTwoOperators) as AvgOperators, MIN(LevelTwoOperators) as MinOperators, MAX(LevelTwoOperators) as MaxOperators, AVG(IssuesRaised) as AvgIssues, MIN(IssuesRaised) as MinIssues, MAX(IssuesRaised) as MaxIssues FROM dbo.FactCallCenter GROUP BY Shift, WageType
Klicken Sie im Entwurfsbereich mit der rechten Maustaste auf die Tabelle Shifts for Call Center, und wählen Sie Daten durchsuchen aus, um eine Vorschau der von der T-SQL-Abfrage zurückgegeben Daten anzuzeigen.
Klicken Sie mit der rechten Maustaste auf die Registerkarte Shifts.dsv (Design) und klicken Sie dann auf Speichern, um die neue Datenquellensichtdefinition zu speichern.
Vorhersagen der Dienstmetrik für jede Schicht
Nachdem Sie nun einige Werte für jede Schicht generiert haben, verwenden Sie diese Werte als Eingabe für das logistische Regressionsmodell, das Sie erstellt haben, um Vorhersagen für die weitere Geschäftsplanung zu generieren.
So verwenden Sie die neue DSV als Eingabe für eine Vorhersageabfrage
Klicken Sie im Data Mining-Designer auf die Registerkarte Miningmodellvorhersage.
Klicken Sie im Bereich Miningmodell auf Modell auswählen, und wählen Sie Call Center - LR aus der Liste der verfügbaren Modelle aus.
Deaktivieren Sie im Menü Miningmodell die Option SINGLETON-Abfrage. Eine Warnung weist Sie darauf hin, dass die Eingaben für die SINGLETON-Abfrage verloren gehen. Klicken Sie auf OK.
Das Dialogfeld SINGLETON-Abfrageeingabe wird durch das Dialogfeld Eingabetabelle(n) auswählen ersetzt.
Klicken Sie auf Falltabelle auswählen.
Wählen Sie im Dialogfeld Tabelle auswählen aus der Liste der DatenquellenShifts aus. Wählen Sie in der Liste Tabellen-/Sichtname den Eintrag Shifts for Call Center aus (wird ggf. automatisch ausgewählt), und klicken Sie dann auf OK.
Die Entwurfsoberfläche Miningmodellvorhersage wird aktualisiert und zeigt die Zuordnungen an, die auf Grundlage der Namen und der Datentypen der Spalten in den Eingabedaten und in dem Modell erstellt wurden.
Klicken Sie mit der rechten Maustaste auf eine der Joinlinien und wählen Sie dann Verbindungen ändern aus.
In diesem Dialogfeld können Sie genau sehen, welche Spalten zugeordnet werden und welche nicht. Das Miningmodell enthält Spalten für Calls, Orders, IssuesRaised und LvlTwoOperators, die Sie beliebigen Aggregaten zuordnen können, die Sie basierend auf diesen Spalten in den Quelldaten erstellt haben. In diesem Szenario nehmen Sie eine Zuordnung zu den Mittelwerten vor.
Klicken Sie auf die leere Zelle neben LevelTwoOperators, und wählen Sie Shifts for Call Center.AvgOperators aus.
Klicken Sie auf die leere Zelle neben Calls, und wählen Sie Shifts for Call Center.AvgCalls aus. Klicken Sie dann auf OK.
So erstellen Sie die Vorhersagen für jede Schicht
Klicken Sie im Raster in der unteren Hälfte des Generators für Vorhersageabfragen auf die leere Zelle unter Quelle, und wählen Sie dann Shifts for Call Center aus.
Wählen Sie in der leeren Zelle unter Feld den Eintrag Shift aus.
Klicken Sie auf die nächste leere Zeile im Raster und wiederholen Sie die oben beschriebene Prozedur, um eine weitere Zeile für WageType hinzuzufügen.
Klicken Sie auf die nächste leere Zeile im Raster. Wählen Sie in der Spalte Quelle den Eintrag Vorhersagefunktion aus. Wählen Sie in der Spalte Feld den Eintrag Vorhersagen aus.
Ziehen Sie die Spalte ServiceGrade aus dem Bereich Miningmodell in das Raster, und legen Sie die Spalte in der Zelle Kriterium/Argument ab. Geben Sie im Feld Alias den Eintrag "Predicted Service Grade" ein.
Klicken Sie auf die nächste leere Zeile im Raster. Wählen Sie in der Spalte Quelle den Eintrag Vorhersagefunktion aus. Wählen Sie in der Spalte Feld den Eintrag PredictProbability aus.
Ziehen Sie die Spalte ServiceGrade aus dem Bereich Miningmodell in das Raster, und legen Sie die Spalte in der Zelle Kriterium/Argument ab. Geben Sie im Feld Alias den Begriff "Probability" ein.
Klicken Sie auf Zur Abfrageergebnissicht wechseln, um die Vorhersagen anzuzeigen.
In der folgenden Tabelle werden Beispielergebnisse für jede Schicht angezeigt.
Shift |
WageType |
Predicted Service Grade |
Wahrscheinlichkeit |
---|---|---|---|
AM |
holiday |
0.165 |
0.377520666 |
midnight |
holiday |
0.105 |
0.364105573 |
PM1 |
holiday |
0.165 |
0.40056055 |
PM2 |
holiday |
0.165 |
0.338532973 |
AM |
weekday |
0.165 |
0.370847617 |
midnight |
weekday |
0.08 |
0.352999173 |
PM1 |
weekday |
0.165 |
0.317419177 |
PM2 |
weekday |
0.105 |
0.311672027 |
Vorhersagen zu den Auswirkungen kürzerer Antwortzeiten auf die Dienstqualität
Sie haben mehrere Durchschnittswerte für jede Schicht generiert und diese Werte als Eingaben für das logistische Regressionsmodell verwendet. Da als Geschäftsziel jedoch eine Abbruchrate zwischen 0,00 und 0,05 vorgegeben ist, sind die Ergebnisse nicht sehr ermutigend.
Vom Betriebsteam wird daher beschlossen, einige Vorhersagen auf der Grundlage des ursprünglichen Modells auszuführen, das gezeigt hat, dass sich die Antwortzeit stark auf die Dienstqualität auswirkt. Mit diesen Vorhersagen soll untersucht werden, ob durch eine Verkürzung der durchschnittlichen Antwortzeit für Anrufe die Dienstqualität verbessert werden kann. Was geschieht beispielsweise mit den Werten für Dienstqualität, wenn die Antwortzeit auf 90 Prozent oder sogar 80 Prozent der aktuellen Antwortzeit verkürzt wird?
Es ist einfach, eine Datenquellensicht (Data Source View, DSV) zu erstellen, die die durchschnittlichen Antwortzeiten für jede Schicht berechnet, und dann Spalten hinzuzufügen, die einen Prozentsatz von 80% oder 90% dieser durchschnittlichen Antwortzeit berechnen. Sie können dann die DSV als Eingabe für das Modell verwenden.
Auch wenn die genauen Schritte nicht hier gezeigt werden, vergleicht die folgende Tabelle die Auswirkungen auf Dienstqualität, wenn Sie Antwortzeiten auf 80% oder 90% aktueller Antwortzeiten reduzieren.
Aus diesen Ergebnissen können Sie schließen, dass Sie die Antwortzeit in bestimmten Schichten auf 90 Prozent der aktuellen Rate reduzieren sollten, um die Dienstqualität zu verbessern.
Schicht, Lohn und Tag |
Vorhergesagte Dienstqualität bei aktueller Durchschnittsantwortzeit |
Vorhergesagte Dienstqualität bei Reduzierung der Antwortzeit auf 90 Prozent |
Vorhergesagte Dienstqualität bei Reduzierung der Antwortzeit auf 80 Prozent |
---|---|---|---|
Feiertag Vormittag |
0.165 |
0.05 |
0.05 |
Feiertag Nachmittag 1 |
0.05 |
0.05 |
0.05 |
Feiertag Nacht |
0.165 |
0.05 |
0.05 |
Es gibt eine Vielzahl anderer Vorhersageabfragen, die Sie für dieses Modell erstellen können. Sie können zum Beispiel vorhersagen, wie viele Telefonisten erforderlich sind, um eine bestimmte Dienstqualität zu erreichen oder um eine bestimmte Anzahl von eingehenden Aufrufen entgegenzunehmen. Da Sie in einem logistischen Regressionsmodell mehrere Ausgaben einschließen können, ist es leicht, mit verschiedenen unabhängigen Variablen und Ergebnissen zu experimentieren, ohne mehrere separate Modelle erstellen zu müssen.
Hinweise
Die Data Mining-Add-Ins für Excel 2007 stellen einen Logistic Regression-Assistenten bereit, mit dem komplexe Fragen einfach beantwortet werden können, beispielsweise wie viele Operatoren der Ebene 2 benötigt werden, um die Dienstqualität für eine bestimmte Schicht auf ein Zielniveau anzuheben. Die Data Mining-Add-Ins können kostenlos heruntergeladen werden und enthalten Assistenten, die auf dem neuronalen Netzwerk oder den Logistic Regression-Algorithmen basieren. Weitere Informationen finden Sie unter den folgenden Links:
SQL Server 2005 Data Mining Add-Ins for Office 2007: Szenarienanalysen „Zielsuche“ und „Was-wäre-wenn“
SQL Server 2008 Data Mining Add-Ins for Office 2007: Szenarienanalyse „Zielsuche“, Szenarienanalyse „Was-wäre-wenn“ und Vorhersagerechner
Zusammenfassung
Sie haben gelernt, Miningmodelle zu erstellen, anzupassen und zu interpretieren, die auf dem Microsoft Neural Network-Algorithmus und dem Microsoft Logistic Regression-Algorithmus basieren. Diese Modelltypen bieten sehr umfassende Möglichkeiten und erlauben nahezu unendlich viele Variationen bei der Analyse. Ihre Verwendung kann daher komplex und schwierig sein.
Diese Algorithmen können jedoch viele Kombinationen von Faktoren durcharbeigten und automatisch die stärksten Korrelationen identifizieren. Sie bieten statistische Unterstützung für Erkenntnisse, zu denen Sie bei manuellem Durchsuchen von Daten mit Transact-SQL oder sogar PowerPivot kaum gelangen würden.
Siehe auch
Konzepte
Logistische Regressionsmodell-Abfragebeispiele
Microsoft Logistic Regression-Algorithmus