Lezione 5: Test di modelli (Esercitazione di base sul data mining)
Ora che è stato elaborato il modello tramite il set di training dello scenario relativo al mailing diretto, verranno testati i modelli sul set di testing. La convalida è un passaggio importante del processo di data mining. Prima di distribuire i modelli per il mailing diretto in un ambiente di produzione, è fondamentale verificarne il comportamento in caso di applicazione ai dati real.
Poiché i dati nel set di testing contengono già valori noti per l'acquisto di biciclette, la correttezza delle stime del modello può essere determinata facilmente. Il modello che esegue il meglio verrà usato dal reparto marketing Adventure Works Cycles per identificare i clienti per la loro campagna di distribuzione mirata.
In questa lezione verranno convalidati i modelli utilizzando più metodi:
Verranno eseguite stime rispetto al set di test per verificare come il modello sia accurato sui risultati noti. Si userà un grafico lift per misurare l'efficacia.
Test dell'accuratezza con i grafici di accuratezza (Esercitazione di base sul data mining)
I modelli verranno quindi testati su un subset filtrato dei dati. Sarà possibile confrontare più modelli nello stesso grafico di accuratezza.
Test di un modello filtrato (Esercitazione di base sul data mining)
Per altre informazioni su come la convalida del modello in generale, vedere Concetti relativi al data mining.
Prima attività della lezione
Test dell'accuratezza con i grafici di accuratezza (Esercitazione di base sul data mining)
Lezione precedente
Lezione 4: Esplorazione dei modelli di mailing diretto (Esercitazione di base sul data mining)
Lezione successiva
Lezione 6: Creazione e utilizzo di stime (Esercitazione di base sul data mining)
Vedere anche
Scheda Grafico di accuratezza (vista Grafico di accuratezza modello di data mining)
Grafico di accuratezza (Analysis Services - Data mining)
Test e convalida (Data mining)
Scheda Matrice di classificazione (visualizzazione Grafico accuratezza modello di data mining)
Matrice di classificazione (Analysis Services - Data mining)