Erstellen von Vorhersagen (Lernprogramm zu Data Mining-Grundlagen)
Wenn Sie die Genauigkeit Ihrer Miningmodelle getestet haben und damit zufrieden sind, können Sie Vorhersageabfragen für Data Mining-Erweiterungen (DMX) erstellen. Dazu verwenden Sie im Data Mining-Designer den Generator für Vorhersageabfragen auf der Registerkarte Miningmodellvorhersage.
Der Generator für Vorhersageabfragen verfügt über drei Sichten. In den Sichten Entwurf und Abfrage können Sie die Abfrage erstellen und überprüfen. Danach können Sie die Abfrage ausführen und die Ergebnisse in der Sicht Ergebnis anzeigen.
Weitere Informationen zum Verwenden des Generators für Vorhersageabfragen finden Sie unter Erstellen von DMX-Vorhersageabfragen.
Erstellen einer Abfrage
Der erste Schritt beim Erstellen einer Vorhersageabfrage ist die Auswahl eines Miningmodells und einer Eingabetabelle.
So wählen Sie ein Modell und eine Eingabetabelle aus
Klicken Sie im Data Mining-Designer auf der Registerkarte Miningmodellvorhersage im Feld Miningmodell auf Modell auswählen.
Navigieren Sie im Dialogfeld Miningmodell auswählen zur Struktur Targeted Mailing, erweitern Sie die Struktur, wählen Sie TM_Decision_Tree aus, und klicken Sie auf OK.
Klicken Sie im Feld Eingabetabelle(n) auswählen auf Falltabelle auswählen.
Wählen Sie im Dialogfeld Tabelle auswählen in der Liste Datenquelle den Eintrag Adventure Works DW2008R2 aus.
Wählen Sie in der Liste Tabellen-/Sichtname die Tabelle ProspectiveBuyer (dbo) aus, und klicken Sie dann auf OK.
Die Tabelle ProspectiveBuyer ähnelt weitgehend der Falltabelle vTargetMail.
Zuordnen der Spalten
Wenn Sie die Eingabetabelle ausgewählt haben, erstellt der Generator für Vorhersageabfragen eine Standardzuordnung zwischen dem Miningmodell und der Eingabetabelle, die auf den Spaltennamen basiert. Mindestens eine Spalte in der Struktur muss mit einer Spalte in den externen Daten übereinstimmen.
Wichtig |
---|
Die Daten, die Sie zur Ermittlung der Genauigkeit der Modelle verwenden, müssen eine Spalte enthalten, die der vorhersagbaren Spalte zugeordnet werden kann. |
So ordnen Sie den Eingabetabellenspalten Strukturspalten zu
Klicken Sie mit der rechten Maustaste auf die Verknüpfungslinien zwischen dem Fenster Miningmodell und dem Fenster Eingabetabelle auswählen, und wählen Sie Verbindungen ändern aus.
Beachten Sie, dass nicht jede Spalte zugeordnet wird. Es werden Zuordnungen für mehreren Tabellenspalten hinzugefügt.
Klicken Sie unter Tabellenspalte auf die Zelle Bike Buyer, und wählen Sie in der Dropdownliste ProspectiveBuyer.Unknown aus.
Dies ordnet die vorhersagbare Spalte [Bike Buyer] einer Eingabetabellenspalte zu.
Klicken Sie auf OK.
Klicken Sie im Projektmappen-Explorer mit der rechten Maustaste auf die Datenquellensicht Targeted Mailing, und wählen Sie Sicht-Designer aus.
Klicken Sie mit der rechten Maustaste auf den Titel der Tabelle ProspectiveBuyer, und wählen Sie Neue benannte Berechnung aus.
Geben Sie im Namensfeld für die Spalte den Namen calcAge ein.
Geben Sie im Feld Ausdruck die Zeichenfolge DATEDIFF (YYYY, [BirthDate], getdate()) ein, und klicken Sie dann auf OK.
Die Eingabetabelle enthält keine entsprechende Spalte Age. Dieser Ausdruck berechnet das Kundenalter anhand der Spalte BirthDate in der Eingabetabelle. Da die Spalte Age als wichtigste Spalte für die Vorhersage von Fahrradkäufen identifiziert wurde, muss sie sowohl im Modell als auch in der Eingabetabelle vorhanden sein.
Wählen Sie im Data Mining-Designer die Registerkarte Miningmodellvorhersage aus, und öffnen Sie das Fenster Verbindungen ändern erneut.
Klicken Sie unter Tabellenspalte auf die Zelle Age, und wählen Sie in der Dropdownliste ProspectiveBuyer.calcAge aus.
Klicken Sie auf OK.
Entwerfen einer Vorhersageabfrage
So entwerfen Sie eine Vorhersageabfrage
Die erste Schaltfläche auf der Symbolleiste der Registerkarte Miningmodellvorhersage ist die Schaltfläche Zur Entwurfssicht wechseln/Zur Ergebnissicht wechseln/Zur Abfragesicht wechseln+++. Klicken Sie auf den Pfeil nach unten in dieser Schaltfläche, und wählen Sie Entwurf aus.
Klicken Sie im Raster auf der Registerkarte Miningmodellvorhersage auf die Zelle in der ersten leeren Zeile der Spalte Quelle, und wählen Sie dann Vorhersagefunktion aus.
Hierdurch wird die Zielspalte für die PredictProbability-Funktion angegeben. Weitere Informationen finden Sie unter Data Mining-Erweiterungen (DMX) - Funktionsreferenz.
Wählen Sie in der Zeile Vorhersagefunktion in der Spalte Feld die Option PredictProbability aus.
Wählen Sie oben im Fenster Miningmodell [Bike Buyer] aus, und ziehen Sie den Eintrag in die Zelle Kriterium/Argument.
Wenn Sie die Maustaste loslassen, wird in der Zelle Kriterium/Argument [TM_Decision_Tree].[Bike Buyer] angezeigt.
Klicken Sie in der Spalte Quelle auf die nächste leere Zeile, und wählen Sie dann TM_Decision_Tree aus.
Wählen Sie in der Zeile TM_Decision_Tree in der Spalte Feld die Option Bike Buyer aus.
Geben Sie in der Zeile TM_Decision_Tree in der Spalte Kriterium/Argument den Wert =1 ein.
Klicken Sie in der Spalte Quelle auf die nächste leere Zeile, und wählen Sie dann ProspectiveBuyer aus.
Wählen Sie in der Zeile ProspectiveBuyer in der Spalte Feld die Option ProspectiveBuyerKey aus.
Hierdurch wird der Vorhersageabfrage ein eindeutiger Bezeichner hinzugefügt, sodass Sie feststellen können, wer wahrscheinlich ein Fahrrad kaufen wird und wer nicht.
Fügen Sie dem Raster fünf weitere Zeilen hinzu. Wählen Sie für jede Zeile ProspectiveBuyer als Quelle aus, und fügen Sie dann die folgenden Spalten in den Zellen Feld hinzu:
calcAge
LastName
FirstName
AddressLine1
AddressLine2
Führen Sie zum Schluss die Abfrage aus, und durchsuchen Sie die Ergebnisse.
So führen Sie die Abfrage aus und zeigen die Ergebnisse an
Wählen Sie auf der Registerkarte Miningmodellvorhersage die Schaltfläche Ergebnis aus.
Nachdem die Abfrage ausgeführt wurde und die Ergebnisse angezeigt werden, können Sie die Ergebnisse überprüfen.
Auf der Registerkarte Miningmodellvorhersage werden Kontaktinformationen für potenzielle Kunden angezeigt, die mit hoher Wahrscheinlichkeit als Fahrradkäufer infrage kommen. Die Spalte Ausdruck gibt an, mit welcher Wahrscheinlichkeit die Vorhersage zutrifft. Anhand dieser Ergebnisse können Sie entscheiden, welche potenziellen Kunden beim Targeted Mailing angeschrieben werden sollen.
Klicken Sie auf Speichern, um die Ergebnisse zu speichern.
Nächste Aufgabe in der Lektion
Verwenden von Drillthrough für Strukturdaten (Lernprogramm zu Data Mining-Grundlagen)