Data Mining-Assistent
Der Data Mining-Assistent in Microsoft SQL Server 2005 Analysis Services (SSAS) wird immer dann gestartet, wenn Sie eine neue Miningstruktur einem Data Mining-Projekt hinzufügen. Der Assistent definiert neue Strukturen und darüber hinaus das ursprüngliche Miningmodell für jede Struktur. Die Struktur des ursprünglichen Modells, einschließlich der Tabellen und Spalten, wird von einer vorhandenen Datenquellensicht oder einem Cube abgeleitet.
Sie können die folgenden Aufgaben mit dem Data Mining-Assistenten ausführen:
- Angeben, ob die Data Mining-Struktur und -Modelle von einer relationalen Datenbank oder einem vorhandenen Cube aus einer OLAP-Datenbank abgeleitet werden.
- Den Algorithmus angeben, mit dem das ursprüngliche Modell erstellt wird.
- Die Datenquellensicht oder Cubedimension angeben, die die Trainingsdaten enthält, aus denen das Modell erstellt wird.
- Die Fallmenge definieren, indem Sie eine Falltabelle und geschachtelte Tabellen aus einer relationalen Datenquelle oder den Fallschlüssel und die Spalten auf Fallebene aus einer OLAP-Datenquelle angeben.
- Definieren der Verwendung der Spalten in der Fallmenge.
- Den Spalteninhalt und die Datentypen automatisch erkennen und festlegen.
- Den Cube aufteilen, wenn das Miningmodell auf einer OLAP-Datenquelle basiert.
- Benennen der neuen Miningstruktur und des ursprünglichen Miningmodells.
- Erstellen einer neue Data Mining-Dimension, wenn das Miningmodell auf einer OLAP-Datenquelle basiert.
Nachdem Sie den Data Mining-Assistenten abgeschlossen haben, ändern Sie mit dem Data Mining-Designer die Miningstruktur und -modelle und durchsuchen Sie Daten oder führen Sie Vorhersagen für die Modelle durch.
Weitere Informationen finden Sie unterData Mining-Designer.
Verwenden des Data Mining-Assistenten
Fügen Sie eine neue Miningstruktur einem Analysis Services-Projekt hinzu, um den Data Mining-Assistenten zu starten. Verwenden Sie dazu den Projektmappen-Explorer oder in Business Intelligence Development Studio das Menü Projekt.
Der Data Mining-Assistent verfügt über zwei Zweige, jeweils einen für jeden Datenquellentyp:
- Relationale Miningmodelle
- OLAP-Miningmodelle
Relationale Miningmodelle
Wenn Sie ein Miningmodell aus einer relationalen Datenquelle in Analysis Services erstellen, geben Sie zunächst im Data Mining-Assistenten an, dass eine vorhandene relationale Datenbank zum Definieren der Modellstruktur verwendet werden soll. Geben Sie dann die gewünschte Data Mining-Technik an, indem Sie den geeignetsten Algorithmus für die gewünschte Data Mining-Analyse auswählen.
Weitere Informationen finden Sie unterData Mining-Algorithmen.
Angeben der Datenquellensicht und der Tabellentypen
Mit den nächsten Schritten im Assistenten wählen Sie die gewünschte Datenquellensicht zum Definieren der Miningstruktur aus, und geben Sie eine Falltabelle an. Die Falltabelle enthält die Trainingsdaten, mit denen das Miningmodell trainiert wird. Geben Sie außerdem Tabellen an, die innerhalb der Falltabelle geschachtelt werden, wenn sich die Daten in mehreren Tabellen befinden.
Weitere Informationen finden Sie unterGeschachtelte Tabellen.
Angeben der Spaltenverwendung
Nachdem Sie die Falltabelle und die geschachtelten Tabellen angegeben haben, bestimmen Sie den Verwendungstyp für alle Spalten in den Tabellen, die in der Miningstruktur enthalten sein sollen. Wenn Sie keinen Verwendungstyp für eine Spalte angeben, wird die Spalte nicht in die Miningstruktur übernommen. Es gibt vier Typen von Data Mining-Spalten: Schlüsselspalte, Eingabespalte, vorhersagbare Spalte oder eine Kombination aus Eingabespalte und vorhersagbarer Spalte. Schlüsselspalten enthalten einen eindeutigen Bezeichner für jede Zeile in einer Tabelle. Einige Miningmodelle, wie die Sequenzcluster- und Zeitreihenmodelle, können mehrere Schlüsselspalten enthalten. Eingabespalten stellen die Informationen bereit, aus denen Vorhersagen erstellt werden. Vorhersagbare Spalten enthalten die Informationen, die im Miningmodell vorhergesagt werden sollen.
Eine Reihe von Tabellen kann z. B. Kundenbezeichner, demographische Informationen und die Geldbeträge enthalten, die jeder Kunde in einem bestimmten Laden ausgegeben hat. Durch den Kundenbezeichner werden die Kunden eindeutig identifiziert und darüber hinaus wird eine Verknüpfung der Falltabelle zu den geschachtelten Tabellen erstellt. Aus diesem Grund würden Sie diese Spalte als Schlüsselspalte verwenden. Sie könnten eine Auswahl von Spalten mit den demographischen Informationen als Eingabespalten verwenden und die Spalten, die den Geldbetrag beschreiben, den jeder Kunde ausgibt, als eine vorhersagbare Spalte. Sie könnten anschließend ein Miningmodell erstellen, das eine Beziehung zwischen demographischen Informationen und den Geldbeträgen herstellt, die ein Kunde in einem Laden ausgibt. Dieses Modell können Sie als Grundlage für gezieltes Marketing verwenden.
Der Data Mining-Assistent stellt das Feature Vorschlagen bereit, das aktiviert ist, wenn Sie eine vorhersagbare Spalte auswählen. Datasets enthalten häufig mehr Spalten als Sie benötigen, um ein Miningmodell zu erstellen. Das Feature Vorschlagen berechnet einen numerischen Ergebniswert von 0 bis 1, der die Beziehung zwischen jeder Spalte im Dataset und der vorhersagbaren Spalte beschreibt. Auf Grundlage des Ergebniswerts empfiehlt das Feature Spalten, die als Eingabespalten für das Miningmodell verwendet werden können. Wenn Sie das Feature Vorschlagen verwenden, können Sie entweder die vorgeschlagenen Spalten verwenden, die Auswahl Ihren Anforderungen entsprechend anpassen oder die Vorschläge ignorieren.
Angeben der Inhalts- und Datentypen
Nachdem Sie mindestens eine vorhersagbare Spalte und Eingabespalte ausgewählt haben, können Sie für jede Spalte die Inhalts- und Datentypen angeben.
Weitere Informationen finden Sie unterDatentypen (Data Mining), Inhaltstypen (Data Mining).
Abschließen des Assistenten
Der letzte Schritt im Assistenten besteht aus der Benennung der Miningstruktur und dem damit verbundenen Miningmodell. Wenn Sie Drillthrough zulassen auswählen, wird die Drillthroughfunktionalität im Modell aktiviert. Auf diese Weise können Sie die Quelldaten analysieren, die beim Erstellen des Modells verwendet wurden.
Zurück zum Anfang
OLAP-Miningmodelle
Beim Erstellen eines multidimensionalen Miningmodells aus einer OLAP-Datenquelle in Analysis Services geben Sie zuerst im Data Mining-Assistenten an, dass Sie einen vorhandenen Cube zum Definieren der Struktur des Modells verwenden möchten. Geben Sie dann die gewünschte Data Mining-Technik an, indem Sie den geeignetsten Algorithmus für die gewünschte Data Mining-Analyse auswählen.
Weitere Informationen finden Sie unterData Mining-Algorithmen.
Angeben der Datenquelle und des Fallschlüssels
Wählen Sie dann die Cubedimension aus, die als Datenquelle zum Definieren der Miningstruktur verwendet werden soll. Wählen Sie anschließend ein Attribut aus, das als Schlüssel oder Fallschlüssel des Miningmodells verwendet werden soll.
Hinweis: |
---|
Das von Ihnen erstellte OLAP-Miningmodell und der Quellcube, den Sie zum Erstellen des Modells verwenden, müssen sich in derselben Analysis Services-Datenbank befinden. |
Angeben der Spalten auf Fallebene und der Spaltenverwendung
Nachdem Sie einen Fallschlüssel ausgewählt haben, werden die Attribute und Measures, die mit dem Schlüssel verbunden sind, in einer Strukturansicht auf der nächsten Seite des Assistenten angezeigt. Wählen Sie aus dieser Liste die Attribute und Measures aus, die als Spalten der Struktur verwendet werden sollen. Diese Spalten werden Spalten auf Fallebene genannt. Wie beim relationalen Modell müssen Sie darüber hinaus angeben, wie jede Spalte in der Struktur verwendet werden soll. Diese Einstellungen nehmen Sie auf der nächsten Seite des Assistenten vor. Bei den Spalten kann es sich um Schlüssel-, Eingabe, vorhersagbare, Eingabe- und vorhersagbare und nicht ausgewählte Spalten handeln.
Hinzufügen von geschachtelten Tabellen
Der OLAP-Zweig des Data Mining-Assistenten beinhaltet die Option, geschachtelte Tabellen der Miningmodellstruktur hinzuzufügen. Klicken Sie auf der Seite Verwendung der Miningmodellspalte angeben des Assistenten auf Geschachtelte Tabellen hinzufügen, um ein weiteres Dialogfeld zu öffnen, in dem Sie durch die Schritte zum Hinzufügen von geschachtelten Tabellen geführt werden. Nur die für die Dimension gültigen Measuregruppen werden angezeigt. Wählen Sie eine Measuregruppe aus, die den Fremdschlüssel der Falldimension enthält. Geben Sie dann die Verwendung für jede Spalte in der Measuregruppe entweder als Eingabe oder als vorhersagbare Spalte an. Im Anschluss daran fügt der Assistent die geschachtelte Tabelle der Falltabelle hinzu. Der Standardname der geschachtelten Tabelle ist der Name der geschachtelten Dimension. Sie können jedoch die geschachtelte Tabelle und die darin befindlichen Spalten umbenennen. Weitere Informationen finden Sie unterGeschachtelte Tabellen.
Angeben der Inhalts- und Datentypen
Nachdem Sie mindestens eine vorhersagbare Spalte und Eingabespalte ausgewählt haben, können Sie für jede Spalte die Inhalts- und Datentypen angeben.
Weitere Informationen finden Sie unterDatentypen (Data Mining), Inhaltstypen (Data Mining).
Aufteilen des Quellcubes
Im OLAP-Zweig des Assistenten können Sie den Bereich des Miningmodells beschränken, indem Sie den Quellcube aufteilen, bevor Sie mit dem Training des Miningmodells beginnen. Das Aufteilen des Cubes in Slices ähnelt dem Hinzufügen einer WHERE-Klausel zu einer SQL-Anweisung. Wenn der Cube z. B. Informationen zum Kauf von Produkten enthält, können Sie für ein Altersattribut als Begrenzung über 30 Jahre, für eine Geschlechterspalte nur weiblich und für das Kaufdatum nicht vor März 2000 festlegen. Auf diese Weise können Sie den Bereich für das Modell auf eine weibliche Person begrenzen, die über 30 Jahre alt ist und Produkte nach März 2000 eingekauft hat.
Abschließen des Assistenten
Der letzte Schritt im Assistenten besteht aus der Benennung der Miningstruktur und dem damit verbundenen Miningmodell. Wenn Sie Drillthrough zulassen auswählen, wird die Drillthroughfunktionalität im Modell aktiviert. Auf diese Weise können Sie die Quelldaten analysieren, die beim Erstellen des Modells verwendet wurden. Sie können außerdem auf Grundlage des Miningmodells angeben, ob eine neue Dimension dem Quellcube hinzugefügt oder ein neuer Cube aus dem Miningmodell erstellt werden soll.
Zurück zum Anfang
Siehe auch
Konzepte
Erstellen einer neuen Miningstruktur
Verwalten von Miningmodellen im Data Mining-Designer
Data Mining-Konzepte
Verwenden der Data Mining-Tools
Verwenden von Data Mining
Andere Ressourcen
Vorgehensweisen zur Miningstruktur-Registerkarte