Prüfen des Market Basket-Modells (Mittleres Data Mining Tutorial)
Sie haben das Modell Association erstellt und können es jetzt überprüfen. Dazu verwenden Sie den Microsoft Zuordnungs-Viewer auf der Registerkarte Miningmodell-Viewer des Data Mining-Designers. Dieses Lernprogramm führt Sie durch die Verwendung des Viewers, um Beziehungen zwischen Elementen zu untersuchen. Der Viewer hilft Ihnen, schnell zu erkennen, welche Produkte häufig zusammen angezeigt werden, und eine allgemeine Vorstellung von den so entstehenden Muster zu erhalten.
Der Microsoft Association Viewer enthält drei Registerkarten: Regeln, Itemsets und Abhängigkeitsnetzwerk. Da jede Registerkarte eine etwas andere Sicht der Daten zeigt, werden Sie bei der Untersuchung eines Modells in der Regel mehrmals zwischen den einzelnen Bereichen hin und her wechseln, während Sie die Einsichten verfolgen.
Registerkarte "Abhängigkeitsnetzwerk"
Registerkarte "Itemsets"
Registerkarte "Regeln"
Generische Inhaltssicht
In diesem Lernprogramm fangen Sie mit der Registerkarte Abhängigkeitsnetzwerk an und verwenden dann die Registerkarten Regeln und Itemsets, um das Verständnis für die im Viewer enthüllten Beziehungen zu vertiefen. Sie rufen außerdem mittels Microsoft Generic Content Tree Viewer ausführliche Statistiken für einzelne Regeln oder Itemsets ab.
Registerkarte "Abhängigkeitsnetzwerk"
Mithilfe der Registerkarte Abhängigkeitsnetzwerk können Sie die Interaktionen der verschiedenen Elemente im Modell prüfen. Jeder Knoten im Viewer steht für ein Element, und die Linien zwischen diesen Knoten stellen Regeln dar. Wenn Sie einen Knoten auswählen, können Sie feststellen, welcher andere Knoten das ausgewählte Element vorhersagt oder welche Elemente von dem aktuellen Element vorhergesagt werden. In einigen Fällen besteht eine zweiseitige Beziehung zwischen Elementen, was bedeutet, dass sie häufig in der gleichen Transaktion auftreten. Mithilfe der Farblegende am unteren Rand der Registerkarte können Sie die Richtung der Beziehung feststellen.
Eine Zeile, die zwei Elemente verbindet, zeigt an, dass diese Elemente wahrscheinlich zusammen in einer Transaktion angezeigt werden. Anders ausgedrückt, kaufen Kunden wahrscheinlich beide Elemente. Der Schieberegler ist mit der Wahrscheinlichkeit der Regel verknüpft. Verschieben Sie den Schieberegler nach oben oder unten, um schwache Zuordnungen herauszufilten, das heißt Regeln mit niedriger Wahrscheinlichkeit.
Das Abhängigkeitsnetzwerkdiagramm zeigt paarweise Regeln an, die logisch als A->B dargestellt werden können: Wenn Produkt A gekauft wird, wird wahrscheinlich auch Produkt B gekauft. Das Diagramm kann keine Regeln des Typs AB->C anzeigen. Wenn Sie den Schieberegler verschieben, um alle Regeln anzuzeigen, jedoch immer noch keine keine Zeilen im Diagramm angezeigt werden, bedeutet dies, dass es keine paarweisen Regeln gibt, die die Kriterien der Algorithmusparameter erfüllen.
Sie können auch Knoten nach Namen suchen,indem sie die ersten Buchstaben des Attributnamens eingeben. Weitere Informationen finden Sie unter Knoten suchen-Dialogfeld (Miningmodell-Viewer-Ansicht).
So öffnen Sie den Zuordnungsmodus im Microsoft Association Rules-Viewer
Doppelklicken Sie in Projektmappen-Explorer auf die Zuordnungsstruktur.
Klicken Sie im Data Mining-Designer auf die Registerkarte Miningmodell-Viewer.
Wählen Sie "Zuordnung" aus der Liste der Miningmodelle in der Dropdownliste Miningmodell aus.
So navigieren Sie im Abhängigkeitsdiagramm und suchen bestimmte Knoten
Klicken Sie in Miningmodell-Viewer auf die Registerkarte Abhängigkeitsnetzwerk.
Klicken Sie mehrmals auf Vergrößern, bis Sie die Bezeichnungen für jeden Knoten leicht lesen können.
Standardmäßig wird das Diagramm mit allen Knoten angezeigt. In einem komplexen Modell gibt es möglicherweise viele Knoten, sodass die einzelnen Knoten möglicherweise sehr klein angezeigt werden.
Klicken Sie auf das Zeichen + unten rechts im Viewer, und halten Sie die Maustaste gedrückt, um im Diagramm zu navigieren.
Ziehen Sie links im Viewer den Schieberegler nach unten, und verschieben Sie ihn von Alle Links (Standardeinstellung) ganz nach unten.
Der Viewer aktualisiert das Diagramm, sodass jetzt nur die stärkste Zuordnung zwischen den Elementen "Touring Tire" und "Touring Tire Tube" angezeigt wird.
Klicken Sie auf den Knoten mit der Bezeichnung Touring Tire Tube = Existing.
Das Diagramm wird aktualisiert, sodass nur Elemente, die stark mit diesem Element verbunden sind, hervorgehoben werden. Beachten Sie die Richtung des Pfeils zwischen den beiden Elementen.
Ziehen Sie auf der linken Seite des Viewers den Schieberegler wieder nach oben, indem Sie ihn von unten bis etwa zur Mitte verschieben.
Beachten Sie die Änderungen im Pfeil, der die beiden Elemente verbindet.
Wählen Sie Nur Attributnamen anzeigen aus der Dropdownliste am oberen Rand des Bereichs "Abhängigkeitsnetzwerk" aus.
Die Beschriftungen im Diagramm werden aktualisiert, um nur den Modellnamen anzuzeigen.
Zurück zum Anfang
Registerkarte "Itemsets"
Nun erfahren Sie mehr über die Regeln und die Itemsets, die vom Modell für die Touring Tire- und Touring Tire Tube-Produkte generiert wurden. Auf der Registerkarte Itemsets werden drei wichtige Arten von Informationen angezeigt, die sich auf Itemsets beziehen und über den Microsoft Association-Algorithmus ermittelt werden:
**Unterstützung: **Die Anzahl der Transaktionen, in denen das Itemset vorkommt.
**Größe: **Die Anzahl der Artikel im Itemset.
**Elemente: **Eine Liste der Elemente, die in den einzelnen Itemsets enthalten sind.
Abhängig davon, wie die Parameter für den Algorithmus festgelegt werden, generiert der Algorithmus möglicherweise zahlreiche Itemsets. Jedes Itemset, das im Viewer zurückgegeben wird, stellt Transaktionen dar, in denen das Element verkauft wurde. Über die Steuerelemente oben auf der Registerkarte Itemsets können Sie einen Filter für den Viewer festlegen, sodass nur Itemsets mit einem festgelegten Mindestwert für den Unterstützungswert und einer bestimmten Mindestgröße angezeigt werden.
Wenn Sie mit einem anderen Miningmodell arbeiten, und es werden keine Itemsets aufgeführt, bedeutet dies, dass keine Itemsets vorhanden sind, die die Kriterien der Algorithmusparameter erfüllen. In einem solchen Szenario können Sie die Algorithmusparameter ändern, um Itemsets zuzulassen, die eine niedrigere Unterstützung haben.
So filtern Sie die Itemsets, die im Viewer nach Namen angezeigt werden
Klicken Sie auf die Registerkarte Itemsets des Viewers.
Geben Sie im Feld Itemset filtern den Text Touring Tire ein, und klicken Sie dann außerhalb des Felds.
Der Filter gibt alle Elemente zurück, die diese Zeichenfolge enthalten.
Wählen Sie in der Liste Anzeigen den Eintrag Nur Attributnamen anzeigen aus.
Aktivieren Sie das Kontrollkästchen Langen Namen anzeigen.
Die Liste der Itemsets wird aktualisiert, um nur die Itemsets anzuzeigen, die die Zeichenfolge "Touring Tire" enthalten. Der lange Name des Itemsets enthält den Namen der Tabelle, die das Attribut und den Wert für jedes Element enthält.
Deaktivieren Sie das Kontrollkästchen Langen Namen anzeigen.
Die Liste der Itemsets wird aktualisiert, um nur den kurzen Namen anzuzeigen.
Die Werte in der Spalte Unterstützung geben die Anzahl der Transaktionen für jedes Itemset an. Eine Transaktion für ein Itemset bedeutet einen Kauf, der alle Elemente im Itemset enthält.
Standardmäßig werden im Viewer die Itemsets in absteigender Reihenfolge nach Unterstützung aufgelistet. Sie können auf die Spaltenheader klicken, um nach einer anderen Spalte zu sortieren, z. B. nach der Größe oder dem Namen des Itemsets. Wenn Sie mehr über die einzelnen Transaktionen erfahren möchten, die in einem Itemset enthalten sind, können Sie einen Drillthrough von den Itemsets zu den einzelnen Fällen ausführen. Die Strukturspalten in den Drillthroughergebnissen sind die Einkommensebene und die Kunden-ID des Kunden. Diese wurden im Modell nicht verwendet.
So zeigen Sie Details für ein Itemset an
Klicken Sie in der Liste der Itemsets auf die Spaltenüberschrift Itemset, um nach Namen zu sortieren.
Suchen Sie das Element Touring Tire (ohne zweites Element).
Klicken Sie mit der rechten Maustaste auf das Element Touring Tire, wählen Sie Drillthrough ausführen aus und dann Modell- und Strukturspalten.
Im Dialogfeld Drillthrough ausführen werden die einzelnen als Unterstützung für dieses Itemset verwendeten Transaktionen angezeigt.
Erweitern Sie die geschachtelte Tabelle "vAssocSeqLineItems", um die tatsächliche Liste von Käufen in der Transaktion anzuzeigen.
So filtern Sie Itemsets nach Unterstützung oder Größe
Löschen Sie den Text, der im Feld Filteritemset möglicherweise angezeigt wird. Sie können einen Textfilter nicht zusammen mit einem numerischen Filter verwenden.
Geben Sie im Feld Minimale Unterstützung "100" ein, und klicken Sie dann auf den Hintergrund des Viewers.
Die Liste der Itemsets wird aktualisiert, um nur Itemsets mit einer Unterstützung von mindestens 100 anzuzeigen.
Zurück zum Anfang
Registerkarte "Regeln"
Auf der Registerkarte Regeln werden folgende Informationen angezeigt, die sich auf die Regeln beziehen, die der Algorithmus ermittelt.
**Wahrscheinlichkeit: ** Die Wahrscheinlichkeit einer Regel, definiert als die Wahrscheinlichkeit des Elements rechts auf der Basis des Elements links.
**Wichtigkeit: ** Ein Maß für die Nützlichkeit einer Regel. Ein höherer Wert bedeutet eine bessere Regel.
"Wichtigkeit" wird bereitgestellt, um Ihnen zu helfen, die Nützlichkeit einer Regel zu bewerten, da die Wahrscheinlichkeit alleine irreführend sein kann. Wenn jede Transaktion z. B. eine Flasche Mineralwasser enthält - wenn vielleicht dem Einkaufswagen jedes Kunden als Teil einer Werbeaktion die Flasche automatisch hinzugefügt wird - würde das Modell eine Regel erstellen, die vorhersagt, dass diese Flasche Mineralwasser eine Wahrscheinlichkeit von 1 hat. In Bezug auf die Wahrscheinlichkeit ist diese Regel sehr genau, enthält jedoch keine nützlichen Informationen.
**Rule: **Gibt die Definition der Regel an. Für ein Market Basket-Modell beschreibt eine Regel eine bestimmte Kombination von Elementen.
Jede Regel kann verwendet werden, um das Vorhandensein eines Elements in einer Transaktion abhängig vom Vorhandensein anderer Elemente vorherzusagen. Genau wie im Fall der Registerkarte Itemsets können Sie die Regeln filtern, sodass nur die interessantesten Regeln angezeigt werden. Wenn Sie mit einem Miningmodell arbeiten, das keine Regeln hat, möchten Sie die Algorithmusparameter möglicherweise ändern, um die Wahrscheinlichkeitsschwelle für Regeln zu senken.
So zeigen Sie nur Regeln an, die das Mountain-200-Fahrrad enthalten
Klicken Sie auf der Registerkarte Miningmodell-Viewer auf die Registerkarte Regeln.
Geben Sie im Feld Filterregel den Text Mountain-200 ein.
Deaktivieren Sie das Kontrollkästchen Langen Namen anzeigen.
Wählen Sie in der Liste Anzeigen den Eintrag Nur Attributnamen anzeigen aus.
Der Viewer zeigt dann nur die Regeln an, die den Begriff Mountain-200 enthalten. Die Wahrscheinlichkeit der Regel sagt Ihnen, wie wahrscheinlich es ist, dass jemand auch das andere aufgelistete Produkt kauft, wenn diese Person auch ein Mountain-200-Fahrrad kauft.
Die Regeln werden in absteigender Reihenfolge nach ihrer Wahrscheinlichkeit angeordnet, Sie können jedoch auf die Spaltenüberschriften klicken, um die Sortierreihenfolge zu ändern. Wenn Sie mehr über eine bestimmte Regel erfahren möchten, können Sie die unterstützenden Fälle mithilfe eines Drillthroughs anzeigen.
So zeigen Sie Fälle an, die eine bestimmte Regel unterstützen
Klicken Sie mit der rechten Maustaste auf der Registerkarte Regeln auf die Regel, die Sie anzeigen möchten.
Wählen Sie Drillthrough ausführen und dann Modell- und Strukturspalten oder Modell- und Strukturspalten aus.
Im Dialogfeld Drillthrough ausführen werden am oberen Rand des Bereichs eine Zusammenfassung der Regel sowie eine Liste aller Fälle bereitgestellt, die als unterstützende Daten für die Regel verwendet wurden.
Zurück zum Anfang
Generic Content Tree Viewer
Dieser Viewer kann für alle Modelle verwendet werden, unabhängig vom Algorithmus oder Modelltyp. Der Microsoft Generic Content Tree Viewer ist in der Dropdownliste Viewer verfügbar.
Eine Inhaltsstruktur ist die Darstellung eines Mining-Modells als eine Reihe von Knoten, in der jeder Knoten das erlangte Wissen über eine Teilmenge der Daten repräsentiert. Der Knoten kann ein Muster, ein Regelsatz, ein Cluster oder die Definition eines Datenbereichs mit gemeinsamen Merkmalen sein. Der genaue Inhalt des Knotens ist je nach Algorithmus und Typ des vorhersagbaren Attributs unterschiedlich, die allgemeine Darstellung des Inhalts ist jedoch gleich. Sie können jeden Knoten erweitern, um zunehmend mehr Details anzuzeigen, und Sie können den Inhalt eines Knotens in die Zwischenablage kopieren.
So zeigen Sie Details der Regel mittels des Inhalts-Viewer an
Wählen Sie auf der Registerkarte Miningmodell-Viewer die Option Microsoft Generic Content Tree Viewer aus der Liste Viewer aus.
Führen Sie im Bereich "Knotenbeschriftung" einen Bildlauf nach unten durch, und klicken Sie auf den letzten Knoten.
Der Viewer zeigt zuerst Itemsets und dann Regeln an, gruppiert diese jedoch nicht. Die einfachste Art, einen bestimmten Knoten zu finden, besteht in der Erstellung einer Inhaltsabfrage. Weitere Informationen finden Sie unter Abfragen eines Zuordnungsmodells (Analysis Services – Data Mining).
Überprüfen Sie im Bereich "Knotendetails" den Wert für NODE_TYPE und NODE_DESCRIPTION.
Ein Knotentyp von 8 ist eine Regel, und ein Knotentyp von 7 ist ein Itemset. Im Fall einer Regel nennt der Wert von NODE_DESCRIPTION Ihnen die Bedingungen, die die Regel bilden. Im Fall eines Itemsets nennt Ihnen der Wert von NODE_DESCRIPTION die im Itemset enthaltenen Elemente.
Sie können auch eine Inhaltsabfrage erstellen, um ausführliche Statistiken zu den Regeln abzurufen. Weitere Informationen zum Interpretieren des Modellinhalts für bestimmte Algorithmen finden Sie unter Miningmodellinhalt von Zuordnungsmodellen (Analysis Services – Data Mining).
Zurück zum Anfang
Nächste Aufgabe in dieser Lektion
Siehe auch