Condividi tramite


Test dell'accuratezza con i grafici di accuratezza (Esercitazione di base sul data mining)

Nella scheda Grafico accuratezza modello di data mining di Progettazione modelli di data mining è possibile calcolare il grado di accuratezza delle stime eseguite dai modelli e si possono confrontare i risultati di ogni modello con quelli degli altri. Questo metodo comparativo è noto come grafico di accuratezza. In genere, l'accuratezza predittiva di un modello di data mining è misurata dall'accuratezza stessa del modello o dall'accuratezza della classificazione. Per questa esercitazione si utilizzerà solo il grafico di accuratezza. Per ulteriori informazioni sull'utilizzo dei grafici di accuratezza e di altro tipo, vedere Strumenti per la creazione di grafici di accuratezza dei modelli (Analysis Services - Data mining).

In questo argomento verranno eseguite le attività seguenti:

  • Scelta dei dati di input

  • Selezione di modelli, colonne stimabili e valori

Scelta dei dati di input

Il primo passaggio per verificare l'accuratezza dei modelli di data mining consiste nel selezionare l'origine dati che verrà utilizzata per il testing. Si testerà l'accuratezza dei modelli rispetto ai dati di testing, quindi li si utilizzerà con dati esterni.

Per selezionare il set di dati

  1. In Business Intelligence Development Studio passare alla scheda Grafico di accuratezza modello di data mining di Progettazione modelli di data mining e selezionare la scheda Selezione input.

  2. Nella casella di gruppo Seleziona set di dati da utilizzare per il grafico di accuratezza selezionare Utilizza test case della struttura di data mining per testare i modelli tramite i dati di testing riservati quando è stata creata la struttura di data mining.

    Per ulteriori informazioni sulle altre opzioni, vedere Misurazione dell'accuratezza di un modello di data mining (Analysis Services - Data mining).

Selezione di modelli, colonne stimabili e valori

Il passaggio successivo consiste nel selezionare i modelli che si desidera includere nel grafico di accuratezza, le colonne stimabili con le quali confrontare i modelli e il valore da stimare.

Nota

Le colonne del modello di data mining nell'elenco Nome colonna stimabile sono limitate alle colonne che hanno il tipo di utilizzo impostato su Predict o Predict Only e il tipo di contenuto Discrete o Discretized.

Per visualizzare l'accuratezza dei modelli

  1. Nella scheda Selezione input di Progettazione modelli di data mining, in Selezionare le colonne stimabili del modello di data mining da visualizzare nel grafico di accuratezza, selezionare la casella di controllo Sincronizza colonne e valori di stima.

  2. Nella colonna Nome colonna stimabile verificare che Bike Buyer sia selezionato per ogni modello.

  3. Nella colonna Mostra selezionare ciascun modello.

    Per impostazione predefinita, nella struttura di data mining sono selezionati tutti i modelli. È possibile decidere di non includere un modello. Tuttavia in questa esercitazione verranno lasciati selezionati tutti i modelli.

  4. Nella colonna Valore stima selezionare 1. Lo stesso valore viene inserito automaticamente per ciascun modello che ha la stessa colonna stimabile.

  5. Selezionare la scheda Grafico di accuratezza per visualizzare il grafico di accuratezza.

    Quando si fa clic sulla scheda, viene eseguita una query di stima sul server e sul database per la struttura di data mining e la tabella di input o i dati di test. I risultati vengono tracciati sul grafico.

    Quando si immette un Valore stima, il grafico di accuratezza traccia un modello di ipotesi casuale e un modello ideale. Il modello di data mining creato sarà compreso tra questi due estremi, ovvero tra l'ipotesi casuale e una stima perfetta. Qualsiasi miglioramento dell'ipotesi casuale viene considerato un livello di accuratezza.

  6. Utilizzare la legenda per individuare le linee colorate che rappresentano il modello ideale e il modello di ipotesi casuale.

    Si noterà che il modello TM_Decision_Tree fornisce il maggiore livello di accuratezza, superando sia il modello Clustering che quello Naive Bayes.

Per una spiegazione dettagliata di un grafico di accuratezza simile a quello creato in questa lezione, vedere Grafico di accuratezza (Analysis Services - Data mining).