Scegliere la colonna da utilizzare per il test di un modello di data mining
Prima di poter misurare l'accuratezza di un modello di data mining, è necessario decidere quale risultato si desidera valutare. La maggior parte dei modelli di data mining richiede che si scelga almeno una colonna da utilizzare come attributo stimabile quando si crea il modello. Pertanto, quando si testa l'accuratezza del modello, è in genere necessario selezionare quell'attributo da testare.
Nell'elenco seguente vengono descritte alcune considerazioni aggiuntive relative alla scelta dell'attributo stimabile da utilizzare nel test:
Alcuni tipi di modelli di data mining possono prevedere più attributi, ad esempio reti neurali, che possono esplorare le relazioni tra molti attributi.
Altri tipi di modelli di data mining, ad esempio modelli di clustering, non hanno necessariamente un attributo prevedibile. Non è possibile testare i modelli di clustering a meno che non dispongano di un attributo stimabile.
Per creare un grafico a dispersione o misurare l'accuratezza di un modello di regressione è necessario scegliere un attributo stimabile continuo come risultato. In questo caso, non è possibile specificare un valore di destinazione. Se si crea qualsiasi grafico diverso da un grafico a dispersione, anche la colonna della struttura di data mining sottostante deve avere un tipo di contenuto Discreto o Discretizzato.
Se si sceglie un attributo discreto come risultato stimabile, è anche possibile specificare un valore di destinazione oppure lasciare vuoto il campo Valore stima . Se si include un valore predict, il grafico misura solo l'efficacia del modello per stimare il valore di destinazione. Se non si specifica un risultato di destinazione, il modello viene misurato per l'accuratezza alla stima di tutti i risultati.
Se si desidera includere più modelli e confrontarli in un singolo grafico di accuratezza, tutti i modelli devono utilizzare la stessa colonna stimabile.
Quando si crea un report di convalida incrociata, Analysis Services analizza automaticamente tutti i modelli con lo stesso attributo prevedibile.
Quando si seleziona l'opzione Sincronizza colonne di stima e valori, Analysis Services sceglie automaticamente colonne prevedibili con gli stessi nomi e tipi di dati corrispondenti. Se le colonne non soddisfano questi criteri, è possibile disabilitare questa opzione e scegliere manualmente una colonna stimabile. Potrebbe essere necessario eseguire questa operazione per il test del modello con un set di dati esterni che dispone di colonne diverse rispetto al modello. Se tuttavia si sceglie una colonna con il tipo di dati errato si verificherà un errore o si otterranno risultati non corretti.
Specificare il risultato da stimare
Fare doppio clic sulla struttura di data mining per aprirla in Progettazione modelli di data mining.
Selezionare la scheda Grafico di accuratezza modello di data mining .
Selezionare la scheda Selezione input .
In Nome colonna stimabile nella scheda Selezione inputselezionare una colonna stimabile per ogni modello incluso nel grafico.
Le colonne del modello di data mining disponibili nella casella Nome colonna stimabile sono limitate solo a quelle con il tipo di utilizzo impostato su Stima o Solo stima.
Se si vuole determinare il livello di accuratezza per un modello, è necessario selezionare un risultato specifico da misurare nell'elenco Valore stima .
Vedere anche
Scegliere ed eseguire il mapping dei dati di test del modello
Scegliere un tipo di grafico di accuratezza e impostare le opzioni del grafico