Freigeben über


Bike Buyer-Lernprogramm zur DMX-Abfragesprache

In diesem Lernprogramm erfahren Sie, wie Miningmodelle mithilfe der Abfragesprache Data Mining-Erweiterungen (Data Mining Extensions, DMX) erstellt, trainiert und analysiert werden. Anschließend verwenden Sie diese Miningmodelle zum Erstellen von Vorhersagen, mit denen sich bestimmen lässt, ob ein Kunde ein Fahrrad kaufen wird.

Die Miningmodelle werden aus den Daten erstellt, die in der AdventureWorksDW2012-Beispieldatenbank enthalten sind, die Daten für das fiktive Unternehmen Adventure Works Cycles speichert. Adventure Works Cycles ist ein großes multinationales Produktionsunternehmen. Das Unternehmen fertigt und verkauft Fahrräder aus Metall und Verbundwerkstoffen auf dem nordamerikanischen, europäischen und asiatischen Markt. Der Hauptsitz befindet sich mit 290 Mitarbeitern in Bothell, Washington. Darüber hinaus sind mehrere regionale Vertriebsteams über die internationalen Zielmärkte des Unternehmens verteilt.

Lernprogrammszenario

Adventure Works Cycles hat beschlossen, ihre Datenanalyse zu erweitern, indem eine benutzerdefinierte Anwendung erstellt wird, die Data Mining-Funktionen verwendet. Das Unternehmen erwartet von dieser benutzerdefinierten Anwendung, dass sie folgende Aufgaben ausführen kann:

  • Spezifische Merkmale eines potenziellen Kunden erfassen und vorhersagen, ob der Kunde ein Fahrrad kaufen wird.

  • Eine Liste potenzieller Kunden erstellen, spezifische Merkmale dieser Kunden erfassen und vorhersagen, welche Kunden ein Fahrrad kaufen werden.

Im ersten Fall werden Kundendaten von einer Kundenregistrierungsseite bereitgestellt, und im zweiten Fall wird eine Liste der potenziellen Kunden von der Adventure Works Cycles-Marketingabteilung bereitgestellt.

Darüber hinaus möchte die Marketingabteilung über die Möglichkeit verfügen, vorhandene Kunden in Kategorien zu gruppieren, die auf Merkmalen wie Wohnort, Anzahl der Kinder und Arbeitsweg basieren. Die Mitarbeiter der Marketingabteilung möchten untersuchen, ob mithilfe dieser Cluster bestimmte Kundengruppen gezielt angesprochen werden können. Dies erfordert ein zusätzliches Miningmodell.

Microsoft SQL Server Analysis Services bietet mehrere Tools, die zum Ausführen dieser Aufgaben verwendet werden können:

Data Mining Extensions (LANGUAGE) ist eine Abfragesprache von Analysis Services, die Sie zum Erstellen und Arbeiten mit Miningmodellen verwenden können. Der Microsoft Decision Trees-Algorithmus erstellt Modelle, mit denen vorhergesagt werden kann, ob jemand ein Fahrrad kauft. Das resultierende Modell akzeptiert als Eingabe einen einzelnen Kunden oder eine Tabelle mit Kunden. Der Microsoft Clustering-Algorithmus kann Gruppierungen von Kunden basierend auf freigegebenen Merkmalen erstellen. Ziel dieses Lernprogramms ist es, die DMX-Skripts bereitzustellen, die in der benutzerdefinierten Anwendung verwendet werden.

Weitere Informationen: Data Mining-Lösungen

Miningstruktur und Miningmodelle

Bevor Sie mit der Erstellung von ASPX-Anweisungen beginnen, ist es wichtig, die wichtigsten Objekte zu verstehen, die Analysis Services zum Erstellen von Miningmodellen verwendet. Die Miningstruktur ist eine Datenstruktur, die die Datendomäne, aus der die Miningmodelle erstellt werden, definiert. Eine einzelne Miningstruktur kann mehrere Miningmodelle enthalten, die dieselbe Domäne verwenden. Ein Miningmodell wendet einen Miningmodellalgorithmus für die Daten an, welcher durch eine Miningstruktur dargestellt wird.

Die Grundbausteine der Miningstruktur sind die Miningstrukturspalten, die die in der Datenquelle enthaltenen Daten beschreiben. Diese Spalten enthalten Informationen, z. B. über den Datentyp, den Inhaltstyp und die Verteilung der Daten.

Miningmodelle müssen die in der Miningstruktur beschriebene Schlüsselspalte sowie eine Teilmenge der übrigen Spalten enthalten. Das Miningmodell definiert die Verwendung jeder einzelnen Spalte und den zum Erstellen des Miningmodells verwendeten Algorithmus. Beispiel: Sie können in DMX angeben, dass eine Spalte eine Schlüsselspalte oder ein PREDICT-Spalte ist. Eine Spalte, für die kein Typ angegeben ist, wird als Eingabespalte behandelt.

Es gibt in DMX zwei Möglichkeiten, Miningmodelle zu erstellen. Sie können die Mininstruktur und das zugehörige Miningmodell entweder zusammen mithilfe der CREATE MINING MODEL-Anweisung erstellen, oder Sie können zuerst mithilfe der CREATE MINING STRUCTURE-Anweisung eine Miningstruktur erstellen und dann der Miningstruktur mithilfe der ALTER STRUCTURE-Anweisung ein Miningmodell hinzufügen. Eine Beschreibung dieser Methoden finden Sie in der folgenden Tabelle.

CREATE MINING MODEL
Verwenden Sie diese Anweisung, um eine Miningstruktur und ihr zugehöriges Miningmodell (unter Verwendung desselben Namens) zusammen zu erstellen. An den Namen des Miningmodells wird "Structure" angefügt, um es von der Miningstruktur zu unterscheiden. Diese Anweisung ist hilfreich, wenn Sie eine Miningstruktur erstellen, die ein einzelnes Miningmodell enthält.

Weitere Informationen finden Sie unter CREATE MINING MODEL (CREATE MINING MODEL, MINING MODEL, CREATE MINING MODEL, MINING MODEL, CREATE MINING

ALTER MINING STRUCTURE
Verwenden Sie diese Anweisung, um einer Miningstruktur ein Miningmodell hinzuzufügen, das bereits auf dem Server vorhanden ist. Diese Anweisung ist hilfreich, wenn Sie eine Miningstruktur erstellen möchten, die mehrere unterschiedliche Miningmodelle enthält. Es kann mehrere Gründe geben, warum Sie einer einzelnen Miningstruktur mehr als nur ein Miningmodell hinzufügen sollten. Ein Grund könnte beispielsweise sein, dass Sie mehrere Miningmodelle mithilfe unterschiedlicher Algorithmen erstellen möchten, um herauszufinden, mit welchem Algorithmus die besten Ergebnisse erzielt werden. Oder Sie möchten beispielsweise mehrere Miningmodelle mithilfe desselben Algorithmus erstellen, einen Parameter für jedes Miningmodell jedoch anders festlegen, um die beste Einstellung für den Parameter zu ermitteln.

Weitere Informationen finden Sie unter ALTER MINING STRUCTURE (MINING STRUCTURE, MINE STRUCTURE).

Da Sie eine Miningstruktur erstellen, die mehrere Miningmodelle beinhaltet, verwenden Sie in diesem Lernprogramm die zweite Methode.

Weitere Informationen

Data Mining Extensions (QUERY) Reference, Understanding the SHAPE Select Statement, Structure and Usage of QUERY Prediction Queries

Lernziele

Dieses Lernprogramm ist in die folgenden Lektionen aufgeteilt:

Lektion 1: Erstellen der Bike Buyer-Miningstruktur
In dieser Lektion erfahren Sie, wie mithilfe der CREATE-Anweisung Miningstrukturen erstellt werden.

Lektion 2: Hinzufügen von Miningmodellen zur Bike Buyer-Miningstruktur
In dieser Lektion erfahren Sie, wie einer Miningstruktur mithilfe der ALTER-Anweisung Miningmodelle hinzugefügt werden.

Lektion 3: Verarbeiten der Bike Buyer-Miningstruktur
In dieser Lektion erfahren Sie, wie mithilfe der INSERT INTO-Anweisung Miningstrukturen und die zugehörigen Miningmodelle verarbeitet werden.

Lektion 4: Durchsuchen des Bike Buyer-Miningmodells
In dieser Lektion erfahren Sie, wie mithilfe der SELECT-Anweisung der Inhalt der Miningmodelle untersucht wird.

Lektion 5: Ausführen von Vorhersageabfragen
In dieser Lektion erfahren Sie, wie mithilfe der PREDICTION JOIN-Anweisung Vorhersagen für Miningmodelle erstellt werden.

Anforderungen

Stellen Sie vor dem Durchführen des Lernprogramms sicher, dass Folgendes installiert ist:

  • Microsoft SQL Server

  • Microsoft SQL Server 2005 Analysis Services (SSAS), SQL Server 2008 Analysis Services (SSAS), SQL Server 2014 Analysis Services (SSAS) oder SQL Server Analysis Services

  • Die AdventureWorksDW2012-Datenbank . Aus Sicherheitsgründen werden die Beispieldatenbanken standardmäßig nicht installiert. Wenn Sie offizielle Beispieldatenbanken für Microsoft SQL Server installieren möchten, besuchen Sie die Seite "Microsoft SQL-Beispieldatenbanken ", und wählen Sie die Datenbanken aus, die Sie installieren möchten.

Hinweis

Zur besseren Anzeige der Lernprogramme empfehlen wir Ihnen, dass Sie der Symbolleiste in der Dokumentanzeige die Schaltflächen Nächstes Thema und Vorheriges Thema hinzufügen.

Weitere Informationen

DMX Market Basket-Tutorial
Tutorial zu Data Mining-Grundlagen