Freigeben über


Erstellen von Vorhersagen (Lernprogramm zu Data Mining-Grundlagen)

Wenn Sie die Genauigkeit Ihrer Miningmodelle getestet haben und damit zufrieden sind, können Sie Vorhersageabfragen erstellen. Dazu verwenden Sie im Data Mining-Designer den Generator für Vorhersageabfragen auf der Registerkarte Miningmodellvorhersage. Über diese Schnittstelle können Sie Abfragen in der Sprache Data Mining-Erweiterungen (Data Mining Extensions, DMX) erstellen. DMX hat eine ähnliche Syntax wie T-SQL, wird jedoch für Abfragen von Data Mining-Objekten verwendet.

Der Generator für Vorhersageabfragen verfügt über drei Sichten. In den Sichten Entwurf und Abfrage können Sie die Abfrage erstellen und überprüfen. Danach können Sie die Abfrage ausführen und die Ergebnisse in der Sicht Ergebnis anzeigen.

Weitere Informationen zum Verwenden des Generators für Vorhersageabfragen finden Sie unter Schnittstellen für Data Mining-Abfragen.

Erstellen einer Abfrage

Der erste Schritt beim Erstellen einer Vorhersageabfrage ist die Auswahl eines Miningmodells und einer Eingabetabelle.

So wählen Sie ein Modell und eine Eingabetabelle aus

  1. Klicken Sie im Data Mining-Designer auf der Registerkarte Miningmodellvorhersage im Feld Miningmodell auf Modell auswählen.

  2. Navigieren Sie im Dialogfeld Miningmodell auswählen zur Struktur Targeted Mailing, erweitern Sie die Struktur, wählen Sie TM_Decision_Tree aus, und klicken Sie auf OK.

  3. Klicken Sie im Feld Eingabetabelle(n) auswählen auf Falltabelle auswählen.

  4. Wählen Sie im Dialogfeld Tabelle auswählen in der Liste Datenquelle den Eintrag Adventure Works DW Multidimensional 2012 aus.

  5. Wählen Sie in der Liste Tabellen-/Sichtname die Tabelle ProspectiveBuyer (dbo) aus, und klicken Sie dann auf OK.

    Die Tabelle ProspectiveBuyer ähnelt weitgehend der Falltabelle vTargetMail.

Zuordnen der Spalten

Wenn Sie die Eingabetabelle ausgewählt haben, erstellt der Generator für Vorhersageabfragen eine Standardzuordnung zwischen dem Miningmodell und der Eingabetabelle, die auf den Spaltennamen basiert. Mindestens eine Spalte in der Struktur muss mit einer Spalte in den externen Daten übereinstimmen.

Wichtiger HinweisWichtig

Die Daten, die Sie zur Ermittlung der Genauigkeit der Modelle verwenden, müssen eine Spalte enthalten, die der vorhersagbaren Spalte zugeordnet werden kann. Wenn so eine Spalte nicht vorhanden ist, können Sie eine Spalte mit leeren Werten erstellen. Sie muss jedoch den gleichen Datentyp wie die vorhersagbare Spalte aufweisen.

So ordnen Sie den Eingabetabellenspalten Strukturspalten zu

  1. Klicken Sie mit der rechten Maustaste auf die Joinlinien zwischen dem Fenster Miningmodell und dem Fenster Eingabetabelle auswählen, und wählen Sie Verbindungen ändern aus.

    Beachten Sie, dass nicht jede Spalte zugeordnet wird. Es werden Zuordnungen für mehreren Tabellenspalten hinzugefügt. Wir generieren außerdem eine neue Geburtsdatumsspalte, die auf der aktuellen Datumsspalte basiert, um die Übereinstimmung zwischen den Spalten zu erhöhen.

  2. Klicken Sie unter Tabellenspalte auf die Zelle Bike Buyer, und wählen Sie in der Dropdownliste ProspectiveBuyer.Unknown aus.

    Dies ordnet die vorhersagbare Spalte [Bike Buyer] einer Eingabetabellenspalte zu.

  3. Klicken Sie auf OK.

  4. Klicken Sie im Projektmappen-Explorer mit der rechten Maustaste auf die Datenquellensicht Targeted Mailing, und wählen Sie Sicht- Designer aus.

  5. Klicken Sie mit der rechten Maustaste auf die ProspectiveBuyer-Tabelle, und wählen Sie Neue benannte Berechnung aus.

  6. Geben Sie im Dialogfeld Benannte Berechnung erstellen im Feld Spaltenname die Zeichenfolge calcAge ein.

  7. Geben Sie unter Beschreibung den Text "Calculate age based on birthdate" ein.

  8. Geben Sie im Feld Ausdruck die Zeichenfolge DATEDIFF(YYYY,[BirthDate],getdate()) ein, und klicken Sie dann auf OK.

    Da in der Eingabetabelle keine Spalte Age enthalten ist, die der Spalte im Modus entspricht, können Sie das Kundenalter in der Spalte BirthDate in der Eingabetabelle mithilfe dieses Ausdrucks berechnen. Da die Spalte Age als wichtigste Spalte für die Vorhersage von Fahrradkäufen identifiziert wurde, muss sie sowohl im Modell als auch in der Eingabetabelle vorhanden sein.

  9. Wählen Sie im Data Mining-Designer die Registerkarte Miningmodellvorhersage aus, und öffnen Sie das Fenster Verbindungen ändern erneut.

  10. Klicken Sie unter Tabellenspalte auf die Zelle Age, und wählen Sie in der Dropdownliste ProspectiveBuyer.calcAge aus.

    VorsichtshinweisVorsicht

    Wenn die Spalte in der Liste nicht angezeigt wird, müssen Sie u. U. die Definition der im Designer geladenen Datenquellensicht aktualisieren. Wählen Sie hierzu im Menü Datei die Option Alle speichern, und schließen Sie anschließend das Projekt und öffnen es erneut im Designer.

  11. Klicken Sie auf OK.

Entwerfen einer Vorhersageabfrage

So entwerfen Sie eine Vorhersageabfrage

  1. Die erste Schaltfläche auf der Symbolleiste der Registerkarte Miningmodellvorhersage ist die Schaltfläche Zur Entwurfssicht wechseln/Zur Ergebnissicht wechseln/Zur Abfragesicht wechseln. Klicken Sie auf den Pfeil nach unten in dieser Schaltfläche, und wählen Sie Entwurf aus.

  2. Klicken Sie im Raster auf der Registerkarte Miningmodellvorhersage auf die Zelle in der ersten leeren Zeile der Spalte Quelle, und wählen Sie dann Vorhersagefunktion aus.

  3. Wählen Sie in der Zeile Vorhersagefunktion in der Spalte Feld die Option PredictProbability aus.

    Geben Sie in der Spalte Alias der gleichen Zeile "Probability of result" ein.

  4. Wählen Sie oben im Fenster Miningmodell [Bike Buyer] aus, und ziehen Sie den Eintrag in die Zelle Kriterium/Argument.

    Wenn Sie die Maustaste loslassen, wird [TM_Decision_Tree].[Bike Buyer] in der Zelle Kriterium/Argument angezeigt.

    Hierdurch wird die Zielspalte für die PredictProbability-Funktion angegeben. Weitere Informationen finden Sie unter Data Mining-Erweiterungen (DMX) - Funktionsreferenz.

  5. Klicken Sie in der Spalte Quelle auf die nächste leere Zeile, und wählen Sie dann TM_Decision_Tree mining model aus.

  6. Wählen Sie in der Zeile TM_Decision_Tree in der Spalte Feld die Option Bike Buyer aus.

  7. Geben Sie in der Zeile TM_Decision_Tree in der Spalte Kriterium/Argument den Wert =1 ein.

  8. Klicken Sie in der Spalte Quelle auf die nächste leere Zeile, und wählen Sie dann ProspectiveBuyer table aus.

  9. Wählen Sie in der Zeile ProspectiveBuyer in der Spalte Feld die Option ProspectiveBuyerKey aus.

    Hierdurch wird der Vorhersageabfrage ein eindeutiger Bezeichner hinzugefügt, sodass Sie feststellen können, wer wahrscheinlich ein Fahrrad kaufen wird und wer nicht.

  10. Fügen Sie dem Raster fünf weitere Zeilen hinzu. Wählen Sie für jede Zeile ProspectiveBuyer table als Quelle aus, und fügen Sie dann die folgenden Spalten in den Zellen Feld hinzu:

    • calcAge

    • LastName

    • FirstName

    • AddressLine1

    • AddressLine2

Führen Sie zum Schluss die Abfrage aus, und durchsuchen Sie die Ergebnisse.

So führen Sie die Abfrage aus und zeigen die Ergebnisse an

  1. Wählen Sie auf der Registerkarte Miningmodellvorhersage die Schaltfläche Ergebnis aus.

  2. Nachdem die Abfrage ausgeführt wurde und die Ergebnisse angezeigt werden, können Sie die Ergebnisse überprüfen.

    Auf der Registerkarte Miningmodellvorhersage werden Kontaktinformationen für potenzielle Kunden angezeigt, die mit hoher Wahrscheinlichkeit als Fahrradkäufer infrage kommen. Die Spalte Probability of result gibt an, mit welcher Wahrscheinlichkeit die Vorhersage zutrifft. Anhand dieser Ergebnisse können Sie entscheiden, welche potenziellen Kunden beim Targeted Mailing angeschrieben werden sollen.

  3. An diesem Punkt können Sie die Ergebnisse speichern. Hierfür stehen drei Möglichkeiten zur Verfügung:

    • Klicken Sie mit der rechten Maustaste auf eine Datenzeile in den Ergebnissen, und wählen Sie Kopieren aus, um nur diesen Wert (und die Spaltenüberschrift) in der Zwischenablage zu speichern.

    • Klicken Sie mit der rechten Maustaste auf eine beliebige Zeile in den Ergebnissen, und wählen Sie Alle kopieren aus, um das gesamte Resultset, einschließlich Spaltenüberschriften, in die Zwischenablage zu kopieren.

    • Klicken Sie auf Abfrageergebnis speichern, um die Ergebnisse wie folgt direkt in einer Datenbank zu speichern:

      1. Wählen Sie im Dialogfeld Ergebnis der Data Mining-Abfrage speichern eine Datenquelle aus, oder definieren Sie eine neue Datenquelle.

      2. Geben Sie einen Namen für die Tabelle ein, in die die Abfrageergebnisse eingefügt werden.

      3. Verwenden Sie die Option Zur Datenquellensicht hinzufügen, um die Tabelle zu erstellen und einer vorhandenen Datenquellensicht hinzuzufügen. Diese Option ist nützlich, wenn Sie alle verknüpften Tabellen für ein Modell – z. B. Trainingsdaten, Vorhersagequelldaten und Abfrageergebnisse – in der gleichen Datenquellensicht beibehalten möchten.

      4. Verwenden Sie die Option Überschreiben, falls vorhanden, um eine vorhandene Tabelle mit den neuesten Ergebnissen zu aktualisieren.

        Sie müssen die Option verwenden, um die Tabelle zu überschreiben, falls Sie der Vorhersageabfrage Spalten hinzugefügt, die Namen oder die Datentypen von Spalten in der Vorhersageabfrage geändert oder ALTER-Anweisungen für die Zieltabelle ausgeführt haben.

        Auch wenn mehrere Spalten den gleichen Namen (z. B. den Standardspaltennamen Ausdruck) haben, müssen Sie einen Alias für Spalten mit doppelten Namen erstellen; andernfalls wird ein Fehler ausgelöst, wenn der Designer versucht, die Ergebnisse unter SQL Server zu speichern. Dies liegt daran, dass mehrere Spalten unter SQL Server nicht über denselben Namen verfügen dürfen.

        Weitere Informationen finden Sie unter Ergebnis der Data Mining-Abfrage speichern (Dialogfeld - Miningmodellvorhersage-Sicht).

Nächste Aufgabe in der Lektion

Verwenden von Drillthrough für Strukturdaten (Lernprogramm zu Data Mining-Grundlagen)

Siehe auch

Aufgaben

Erstellen von Vorhersageabfragen mithilfe des Generators für Vorhersageabfragen

Andere Ressourcen

Verwenden vom Generator für Vorhersageabfragen zum Erstellen von DMX-Vorhersageabfragen