Erstellen der Miningmodellstruktur Targeted Mailing (Data Mining-Lernprogramm)
Als ersten Schritt für das Erstellen eines Targeted Mailing-Szenarios legen Sie mit dem Data Mining-Assistenten in Business Intelligence Development Studio eine neue Miningstruktur und das Decision Tree-Miningmodell an.
Weitere Informationen
Data Mining-Assistent, Data Mining-Designer, Microsoft Decision Trees-Algorithmus
So erstellen Sie eine Miningstruktur für ein Targeted Mailing-Szenario
Klicken Sie im Projektmappen-Explorer mit der rechten Maustaste auf Miningstrukturen, und wählen Sie Neue Miningstruktur aus.
Der Data Mining-Assistent wird geöffnet.
Klicken Sie auf der Seite Willkommen auf Weiter.
Überprüfen Sie auf der Seite Definitionsmethode auswählen, ob die Option Aus vorhandener relationaler Datenbank oder vorhandenem Data Warehouse ausgewählt ist, und klicken Sie dann auf Weiter.
Wählen Sie auf der Seite Data Mining-Technik auswählen unter Welche Data Mining-Technik möchten Sie verwenden? die Option Microsoft Decision Trees.
In diesem Lernprogramm werden Sie mehrere Modelle erstellen, die auf dieser ursprünglichen Miningstruktur basieren. Das erste Modell wird zusammen mit der Struktur erstellt, wenn Sie den Assistenten vollständig ausführen. Es basiert auf dem Microsoft Decision Trees-Algorithmus.
Klicken Sie auf Weiter.
Beachten Sie auf der Seite Datenquellensicht auswählen, dass Adventure Works DW standardmäßig ausgewählt ist. Klicken Sie auf Durchsuchen, um die Tabellen in der Datenquellensicht anzuzeigen, und klicken Sie dann auf Schließen, um zum Assistenten zurückzukehren.
Klicken Sie auf Weiter.
Aktivieren Sie auf der Seite Tabellentypen angeben neben der Tabelle vTargetMail das Kontrollkästchen in der Spalte Fall, und klicken Sie dann auf Weiter.
Überprüfen Sie auf der Seite Trainingsdaten angeben, ob das Kontrollkästchen Schlüssel neben der Spalte CustomerKey aktiviert ist.
Wenn in der Quelltabelle der Datenquellensicht ein Schlüssel angegeben ist, wählt der Data Mining-Assistent automatisch diese Spalte als Schlüssel für das Modell aus.
Aktivieren Sie neben der Spalte BikeBuyer die Kontrollkästchen Eingabe und Vorhersagbar.
Wenn Sie angeben, dass eine Spalte vorhersagbar ist, wird die Schaltfläche Vorschlagen aktiviert. Wenn Sie auf Vorschlagen klicken, wird das Dialogfeld Verbundene Spalten vorschlagen geöffnet, in dem diejenigen Spalten aufgelistet werden, die den engsten Bezug zur vorhersagbaren Spalte haben.
Im Dialogfeld Verbundene Spalten vorschlagen werden die Attribute nach ihrer Abhängigkeit vom vorhersagbaren Attribut angeordnet. Spalten mit einem Wert größer als 0,05 werden automatisch für die Aufnahme ins Modell ausgewählt. Wenn Sie den Vorschlägen zustimmen, klicken Sie auf OK, womit die ausgewählten Spalten im Assistenten als Eingabespalten gekennzeichnet werden. Im Rahmen dieses Lernprogramms ignorieren Sie die Vorschläge und klicken auf Abbrechen.
Aktivieren Sie das Kontrollkästchen Eingabe neben folgenden Spalten:
- Age
- CommuteDistance
- EnglishEducation
- EnglishOccupation
- FirstName
- Gender
- GeographyKey
- HouseOwnerFlag
- LastName
- MaritalStatus
- NumberCarsOwned
- NumberChildrenAtHome
- Region
- TotalChildren
- YearlyIncome
Mithilfe der UMSCHALTTASTE können Sie mehrere Spalten markieren.
Klicken Sie auf Weiter.
Klicken Sie auf der Seite Inhalt und Datentyp der Spalten angeben auf Erkennen.
Ein Algorithmus wird ausgeführt, der numerische Daten prüft und feststellt, ob die numerischen Spalten kontinuierliche oder diskrete Werte enthalten. So kann beispielsweise eine Spalte die Gehaltsdaten in Form tatsächlicher Werte enthalten, welche kontinuierlich sind, oder sie kann ganze Zahlen enthalten, die für codierte Gehaltsbereiche stehen, wie z. B. 1 = < 25.000 Dollar; 2 = von 25.000 bis 50.000 Dollar, welche diskret sind.
Stellen Sie nach dem Klicken auf Erkennen sicher, dass die Einträge in den Spalten Inhaltstyp und Datentyp die in der folgenden Tabelle aufgelisteten Einstellungen aufweisen.
Spalte Inhaltstyp Datentyp Age
Continuous
Long
BikeBuyer
Discrete
Long
CommuteDistance
Discrete
Text
CustomerKey
Key
Long
EnglishEducation
Discrete
Text
EnglishOccupation
Discrete
Text
FirstName
Discrete
Text
Gender
Discrete
Text
GeographyKey
Discrete
Text
HouseOwnerFlag
Discrete
Text
LastName
Discrete
Text
MaritalStatus
Discrete
Text
NumberCarsOwned
Discrete
Long
NumberChildrenAtHome
Discrete
Long
Region
Discrete
Text
TotalChildren
Discrete
Long
YearlyIncome
Continuous
Double
![]() |
---|
Der ausschließlich auf den numerischen Werten basierende Data Mining-Algorithmus legt nahe, dass die Spalte GeographyKey kontinuierliche Zahlen enthält. Zahlen wie zum Beispiel Postleitzahlen sollten jedoch in der Regel als diskrete und nicht als kontinuierliche numerische Werte behandelt werden, weil mathematische Operationen mit diesen Zahlen keinen Sinn ergeben. |
- Klicken Sie auf Weiter.
- Geben Sie auf der Seite Assistenten abschließen bei Miningstrukturname den Namen Targeted Mailing ein.
- Geben Sie im Feld Miningmodellname die Eingabe TM_Decision_Tree ein.
- Aktivieren Sie das Kontrollkästchen Drillthrough zulassen.
- Klicken Sie auf Fertig stellen.
Nächste Aufgabe in dieser Lektion
Ändern des Targeted Mailing-Modells (Data Mining-Lernprogramm)