Lektion 5: Testen von Modellen (Lernprogramm zu Data Mining-Grundlagen)
Nachdem Sie das Modell mit dem Trainingssatz für das Targeted Mailing-Szenario verarbeitet haben, können Sie die Modelle mit dem Testsatz überprüfen. Die Überprüfung ist ein wichtiger Schritt im Data Mining-Prozess. Sie sollten wissen, welche Leistung Ihre Miningmodelle für Targeted Mailing mit echten Daten erzielen, bevor Sie die Modelle in Ihrer Produktionsumgebung bereitstellen.
Da die Daten im Testsatz bereits bekannte Werte für das Fahrradkaufverhalten enthalten, ist es einfach, die Vorhersagegenauigkeit des Modells zu bestimmen. Das Modell, das am besten abschneidet, wird von der Marketingabteilung von Adventure Works Cycles verwendet, um die Kunden für ihre gezielte Mailingkampagne zu identifizieren.
In dieser Lektion überprüfen Sie die Modelle mithilfe mehrerer Methoden:
Sie treffen Vorhersagen für den Testsatz, um zu sehen, wie genau das Modell mit bekannten Ergebnissen ist. Sie verwenden ein Liftdiagramm , um dessen Effektivität zu messen.
Überprüfen der Genauigkeit mit Prognosegütediagrammen (Lernprogramm zu Data Mining-Grundlagen)
Anschließend testen Sie die Modelle mit einer gefilterten Teilmenge der Daten. Sie können mehrere Modelle im selben Prognosegütediagramm vergleichen.
Testen eines gefilterten Modells (Lernprogramm zu Data Mining-Grundlagen)
Weitere Informationen zur Modellvalidierung im Allgemeinen finden Sie unter Data Mining-Konzepte.
Erste Aufgabe in der Lektion
Überprüfen der Genauigkeit mit Prognosegütediagrammen (Lernprogramm zu Data Mining-Grundlagen)
Vorherige Lektion
Lektion 4: Untersuchen der Targeted Mailing-Modelle (Lernprogramm zu Data Mining-Grundlagen)
Nächste Lektion
Lektion 6: Erstellen und Verwenden von Vorhersagen (Lernprogramm zu Data Mining-Grundlagen)
Weitere Informationen
Prognosegütediagramm (Registerkarte, Mininggenauigkeitsdiagramm-Sicht)
Prognosegütediagramm (Analysis Services – Data Mining)
Tests und Überprüfung (Data Mining)
Klassifikationsmatrix (Registerkarte, Mininggenauigkeitsdiagramm-Sicht)
Klassifikationsmatrix (Analysis Services Data Mining)