Lektion 1: Erstellen der Bike Buyer-Miningstruktur
In dieser Lektion erstellen Sie eine Miningstruktur, mit der Sie vorhersagen können, ob ein potenzieller Kunde von Adventure Works Cycles ein Fahrrad kauft. Wenn Sie mit Miningstrukturen und deren Rolle im Data Mining nicht vertraut sind, lesen Sie Miningstrukturen (Analysis Services – Data Mining).
Die Miningstruktur Bike Buyer, die Sie in dieser Lektion erstellen, unterstützt das Hinzufügen von Miningmodellen basierend auf dem Microsoft-Entscheidungsbaumalgorithmus von Microsoft. In späteren Lektionen untersuchen Sie mithilfe der Clustering-Miningmodelle verschiedene Möglichkeiten zum Gruppieren von Kunden und verwenden Entscheidungsstruktur-Miningmodelle, um vorherzusagen, ob ein potenzieller Kunde ein Fahrrad kaufen wird oder nicht.
CREATE MINING STRUCTURE-Anweisung
Um eine Miningstruktur zu erstellen, verwenden Sie die CREATE MINING STRUCTURE (DMX)- Anweisung. Der in der Anweisung enthaltene Code umfasst folgende Abschnitte:
Benennen der -Struktur.
Definieren der Schlüsselspalte.
Definieren der Miningspalten
Definieren eines optionalen Test-Datasets
Es folgt ein allgemeines Beispiel für die CREATE MINING STRUCTURE-Anweisung:
CREATE MINING STRUCTURE [<mining structure name>]
(
<key column>,
<mining structure columns>
)
WITH HOLDOUT (<holdout specifier>)
Die erste Codezeile definiert den Namen der Struktur:
CREATE MINING STRUCTURE [<mining structure name>]
Informationen zum Benennen eines Objekts in Data Mining-Erweiterungen (DMX) finden Sie unter Bezeichner (DMX).
Die nächste Codezeile definiert die Schlüsselspalte für die Miningstruktur, die eine Entität in den Quelldaten eindeutig identifiziert:
<key column>,
In der Miningstruktur, die Sie erstellen, definiert der Kundenbezeichner CustomerKey
eine Entität in den Quelldaten.
Mit der nächsten Codezeile werden die Miningspalten definiert, die von den Miningmodellen verwendet werden, die der Miningstruktur zugeordnet sind:
<mining structure columns>
Sie können die DISCRETIZE-Funktion in <Miningstrukturspalten> verwenden, um fortlaufende Spalten mit der folgenden Syntax zu diskretisieren:
DISCRETIZE(<method>,<number of buckets>)
Weitere Informationen zur Diskretisierung von Spalten finden Sie unter Diskretisierungsmethoden (Data Mining). Weitere Informationen zu den Typen von Miningstrukturspalten, die Sie definieren können, finden Sie unter Miningstrukturspalten.
In der letzten Codezeile wird eine optionale Partition in der Miningstruktur definiert:
WITH HOLDOUT (<holdout specifier>)
Sie geben einen Teil der Daten an, die zum Testen von Miningmodellen verwendet werden sollen, die mit der Struktur verknüpft sind. Die übrigen Daten werden zum Trainieren der Modelle verwendet. Standardmäßig erstellt Analysis Services ein Testdataset, das 30 Prozent aller Falldaten enthält. Sie fügen die Spezifikation hinzu, dass das Test-Dataset 30 % der Fälle bis zu einem Maximum von 1000 Fällen enthalten soll. Wenn 30 % der Fälle weniger sind als 1000, enthält das Test-Dataset den kleineren Wert.
Lektionsaufgaben
Im Rahmen dieser Lektion führen Sie die folgenden Aufgaben aus:
Erstellen Sie eine neue leere Abfrage.
Ändern Sie die Abfrage, um die Miningstruktur zu erstellen.
Ausführen der Abfrage
Erstellen einer Abfrage
Der erste Schritt besteht darin, eine Verbindung mit einer instance von Analysis Services herzustellen und eine neue DMX-Abfrage in SQL Server Management Studio zu erstellen.
So erstellen Sie eine neue DMX-Abfrage in SQL Server Management Studio
Öffnen Sie SQL Server Management Studio.
Wählen Sie im Dialogfeld Verbindung mit Server herstellen unter Servertyp die Option Analysis Services aus. Geben Sie
LocalHost
unter Servername den Namen der instance von Analysis Services ein, mit der Sie für diese Lektion eine Verbindung herstellen möchten. Klicke auf Verbinden.Klicken Sie in Objekt-Explorer mit der rechten Maustaste auf die instance von Analysis Services, zeigen Sie auf Neue Abfrage, und klicken Sie dann auf DMX, um die Abfrage-Editor und eine neue leere Abfrage zu öffnen.
Ändern der Abfrage
Im nächsten Schritt ändern Sie die oben beschriebene CREATE MINING STRUCTURE-Anweisung und erstellen die Bike Buyer-Miningstruktur.
So passen Sie die CREATE MINING STRUCTURE-Anweisung an
Kopieren Sie im Abfrage-Editor das allgemeine Beispiel der CREATE MINING STRUCTURE-Anweisung in die leere Abfrage.
Ersetzen Sie Folgendes:
[<mining structure>]
Durch:
[Bike Buyer]
Ersetzen Sie Folgendes:
<key column>
Durch:
CustomerKey LONG KEY
Ersetzen Sie Folgendes:
<mining structure columns>
Durch:
[Age] LONG DISCRETIZED(Automatic,10), [Bike Buyer] LONG DISCRETE, [Commute Distance] TEXT DISCRETE, [Education] TEXT DISCRETE, [Gender] TEXT DISCRETE, [House Owner Flag] TEXT DISCRETE, [Marital Status] TEXT DISCRETE, [Number Cars Owned] LONG DISCRETE, [Number Children At Home] LONG DISCRETE, [Occupation] TEXT DISCRETE, [Region] TEXT DISCRETE, [Total Children]LONG DISCRETE, [Yearly Income] DOUBLE CONTINUOUS
Ersetzen Sie Folgendes:
WITH HOLDOUT (holdout specifier>)
Durch:
WITH HOLDOUT (30 PERCENT or 1000 CASES)
Die gesamte Miningstrukturanweisung sollte jetzt wie folgt aussehen:
CREATE MINING STRUCTURE [Bike Buyer] ( [Customer Key] LONG KEY, [Age]LONG DISCRETIZED(Automatic,10), [Bike Buyer] LONG DISCRETE, [Commute Distance] TEXT DISCRETE, [Education] TEXT DISCRETE, [Gender] TEXT DISCRETE, [House Owner Flag] TEXT DISCRETE, [Marital Status] TEXT DISCRETE, [Number Cars Owned]LONG DISCRETE, [Number Children At Home]LONG DISCRETE, [Occupation] TEXT DISCRETE, [Region] TEXT DISCRETE, [Total Children]LONG DISCRETE, [Yearly Income] DOUBLE CONTINUOUS ) WITH HOLDOUT (30 PERCENT or 1000 CASES)
Klicken Sie im Menü Datei auf DMXQuery1.dmx speichern unter.
Navigieren Sie im Dialogfeld Speichern unter zum entsprechenden Ordner, und nennen Sie die Datei
Bike Buyer Structure.dmx
.
Ausführen der Abfrage
Im letzten Schritt führen Sie die Abfrage aus. Nachdem eine Abfrage erstellt und gespeichert wurde, muss sie ausgeführt werden. Das bedeutet, die Anweisung muss ausgeführt werden, um auf dem Server eine Miningstruktur zu erstellen. Weitere Informationen zum Ausführen von Abfragen in Abfrage-Editor finden Sie unter Database Engine Abfrage-Editor (SQL Server Management Studio).
So führen Sie die Abfrage aus
Klicken Sie in Abfrage-Editor auf der Symbolleiste auf Ausführen.
Die status der Abfrage wird auf der Registerkarte Meldungen unten in Abfrage-Editor angezeigt, nachdem die Ausführung der Anweisung abgeschlossen ist. Die Meldung sollte Folgendes anzeigen:
Executing the query Execution complete
Auf dem Server ist jetzt eine neue Struktur mit dem Namen Bike Buyer vorhanden.
In der nächsten Lektion fügen Sie der soeben erstellten Struktur Miningmodelle hinzu.
Nächste Lektion
Lektion 2: Hinzufügen von Miningmodellen zur Bike Buyer-Miningstruktur