Erstellen einer neuen Miningstruktur
Wenn Sie in MicrosoftSQL ServerAnalysis Services eine Data Mining-Lösung erstellen, müssen Sie als Erstes eine Miningstruktur mithilfe des Data Mining-Assistent (Analysis Services - Data Mining) in Business Intelligence Development Studio erstellen. Die Miningstrukturen definieren die Datendomäne, aus der die Miningmodelle erstellt werden. Alle Miningmodelle basieren auf einer Struktur.
Miningstrukturen können entweder relationale oder OLAP-Datenquellen (Online Analytical Processing) verwenden. Relationale Miningstrukturen basieren auf Daten, die in relationalen Datenbanksystemen gespeichert sind und als Datenquellensicht definiert werden. OLAP-Miningstrukturen basieren auf einer Dimension und zugehörigen Measures eines OLAP-Cubes, der sich in der gleichen Datenbank wie die Miningstruktur befindet.
Weitere Informationen finden Sie unter:Entwerfen von Datenbanken, Entwerfen von mehrdimensionalen Datenbankobjekten für Analysis Services
Der Data Mining-Assistent definiert automatisch eine Miningstruktur und ermöglicht Ihnen, der Struktur das erste Miningmodell hinzuzufügen. Da eine Miningstruktur mehrere Miningmodelle enthalten kann, können Sie den Data Mining-Designer verwenden, um der Struktur weitere Miningmodelle hinzuzufügen.
In den folgenden Abschnitten erhalten Sie weitere Informationen über die Erstellung neuer Miningstrukturen mithilfe des Data Mining-Assistenten sowie über das Festlegen von Optionen für die Miningstruktur, mit denen Sie einen Testsatz erstellen oder Abfragen mit den Daten in der Miningstruktur ausführen können.
Erstellen einer relationalen Miningstruktur
Erstellen einer OLAP-Miningstruktur
Aktivieren von zurückgehaltenen Daten und Drillthrough
Erstellen einer relationalen Miningstruktur
Relationale Miningstrukturen können auf Daten basieren, die durch eine OLE DB-Datenquelle zur Verfügung gestellt werden. Wenn die Quelldaten in mehreren Tabellen enthalten sind, können Sie diese als einzelne Falltabelle mithilfe von geschachtelten Tabellen in den Assistenten übernehmen.
Weitere Informationen finden Sie unter Geschachtelte Tabellen (Analysis Services - Data Mining)
Der Data Mining-Assistent führt Sie beim Erstellen der Struktur eines neuen Miningmodells durch folgende Schritte:
Auswahl eines Datenquellentyps, in diesem Falle eine relationale Datenbank.
Entscheidung, ob nur eine Struktur oder eine Struktur mit einem Miningmodell erstellt werden soll.
Auswahl eines Algorithmus für das Modell.
Auswahl einer Datenquelle.
Auswahl einer Falltabelle und ggf. von geschachtelten Tabellen.
Auswahl des Typs der einzelnen Spalten, entweder als vorhersagbare, als Eingabe- oder als Schlüsselspalte.
Festlegen der Spalteninhaltstypen.
Angeben eines optionalen zurückgehaltenen Datasets.
Aktivieren von Drillthrough für die Struktur; Benennen und Speichern der neuen Miningstruktur und des zugeordneten Miningmodells.
Weitere Informationen finden Sie unter:Data Mining-Algorithmen (Analysis Services - Data Mining), Miningmodellspalten, Miningstrukturspalten, Datentypen (Data Mining), Inhaltstypen (Data Mining)
Erstellen einer OLAP-Miningstruktur
OLAP-Cubes beinhalten häufig viele Elemente und Dimensionen, sodass es schwierig sein kann, zu entscheiden, wo mit dem Data Mining begonnen werden soll. Um die Muster in den Cubes leichter zu identifizieren, identifizieren Sie normalerweise zuerst eine Dimension von Interesse und durchsuchen dann Muster, die mit dieser Dimension verknüpft sind. In der folgenden Tabelle werden mehrere allgemeine Data Mining-Aufgaben von OLAP aufgelistet, Beispielszenarien zur Anwendung der einzelnen Aufgaben beschrieben und der Data Mining-Algorithmus zum Verwenden für die jeweilige Aufgabe identifiziert.
Aufgabe |
Beispielszenario |
Algorithmus |
---|---|---|
Gruppieren Sie Elemente in Clustern |
Segmentieren Sie eine Kundendimension auf Basis der Kundenelementeigenschaften, der Produkte, die die Kunden kaufen, und des Geldbetrags, den die Kunden ausgeben. |
Microsoft Clustering-Algorithmus |
Finden Sie interessante oder ungewöhnliche Elemente |
Identifizieren Sie interessante oder ungewöhnliche Läden in einer Speicherdimension, basierend auf Nettoumsatz, Gewinn, Ort und Größe des Ladens. |
Microsoft Decision Trees-Algorithmus |
Finden Sie interessante oder ungewöhnliche Zellen |
Identifizieren Sie Umsätze in Läden, die nicht den allgemeinen Trends im Verlauf der Zeit entsprechen. |
Microsoft Time Series-Algorithmus |
Der Data Mining-Assistent führt Sie beim Erstellen der Struktur eines neuen Miningmodells durch folgende Schritte:
Auswahl eines Datenquellentyps, in diesem Falle ein Cube.
Auswahl eines Algorithmus.
Auswahl einer Quellcubedimension.
Auswahl eines Fallschlüssels.
Auswahl von Fallspalten.
Auswahl von geschachtelten Tabellen.
Auswahl der Verwendung der einzelnen Spalten, entweder als vorhersagbare, als Eingabe- oder als Schlüsselspalte.
Festlegen der Spalteninhaltstypen.
Aufteilen des Quellcubes.
Erstellen eines optionalen Test-Datasets
Benennen und Speichern der neuen Miningstruktur und des zugeordneten Miningmodells.
Auf der letzten Seite des Assistenten können Sie die folgenden Optionen festlegen:
Drillthrough zulassen
Miningmodelldimension erstellen
Cube mithilfe der Miningmodelldimension erstellen
Wenn Sie im Quellcube eine neue Miningmodelldimension erstellen möchten, können Sie die Informationen einschließen, die vom Data Mining-Algorithmus in der OLAP-Datenquelle gefunden werden. Wenn Sie eine Miningmodelldimension erstellen, können Sie den Modellinhalt in der Form einer Dimension durchsuchen und abfragen. Die Option steht für Modelle zur Verfügung, die unter Verwendung von Microsoft Clustering, Microsoft Decision Trees und des Microsoft Association Rules-Algorithmus erstellt wurden.
Wenn Sie die Option zum Erstellen eines neuen Cubes auswählen, wird ein neuer Cube in der Datenbank definiert, die die Miningmodelldimension enthält sowie optional alle verknüpften Dimensionen.
Weitere Informationen finden Sie unter Data Mining-Algorithmen (Analysis Services - Data Mining), Miningmodellspalten, Miningstrukturspalten, Datentypen (Data Mining), Inhaltstypen (Data Mining)
Aktivieren von Drillthrough und zurückgehaltenen Daten
Wenn Sie die Miningstruktur erstellen, müssen Sie auch zwei wichtige Optionen für das Arbeiten mit den Daten festlegen: zurückgehaltene Daten und Drillthrough. Zurückgehaltene Daten ist ein SQL Server 2008-Feature, mit dem Sie die Daten in der Miningstruktur in einen Trainingssatz und einen Testsatz partitionieren können, die Sie mit allen Modellen verwenden können, die der Struktur zugeordnet sind. Weitere Informationen finden Sie unter Partitionieren von Daten in Trainings- und Testsätze (Analysis Services - Data Mining).
Mithilfe von Drillthrough können Sie Quelldaten in der Miningstruktur anzeigen, indem Sie das Miningmodell abfragen. Dies ist hilfreich, wenn Sie die Ergebnisse eines Miningmodells anzeigen, und zusätzliche Details der zugrunde liegenden Fälle sehen möchten. Sie können beispielsweise nach Kontaktinformationen suchen oder nach den Fällen, die zum Trainieren eines bestimmten Clusters verwendet wurden usw. Um Drillthrough verwenden zu können, müssen Sie es beim Erstellen der Miningstruktur aktivieren. Eine nachträgliche Aktivierung ist nicht möglich. Weitere Informationen finden Sie unter Verwenden von Drillthrough für Miningmodelle und Miningstrukturen (Analysis Services - Data Mining).
Siehe auch