Crea set di testing (Creazione guidata modello di data mining)
Utilizzare la pagina Crea set di testing per specificare la quantità di dati da utilizzare per il training e la quantità da riservare all'utilizzo come set di test. La separazione dei dati in set di training e set di testing durante la creazione di una struttura di data mining rende molto più facile la determinazione dell'accuratezza dei modelli di data mining che vengono creati successivamente.
È possibile specificare la quantità di dati da testare in percentuale oppure è possibile specificare un numero per limitare il numero di case utilizzato per il test. Se si specifica sia una percentuale che un numero massimo di case da utilizzare per il test, entrambe le impostazioni vengono utilizzate e il set di dati del test contiene il numero più basso di case. Per impostazione predefinita, il 30 per cento dei dati viene utilizzato per il testing e il 70 per cento per il training, senza numero massimo di test case.
Per impostazione predefinita, Analysis Services genera un valore di inizializzazione numerico che viene utilizzato per avviare il partizionamento. Questo valore di inizializzazione è basato sul nome della struttura di data mining. Per assicurarsi che la partizione non venga modificata se viene modificato il nome della struttura di data mining, è possibile specificare un valore per il valore di inizializzazione, configurando la proprietà HoldoutSeed della struttura di data mining. Se si modifica il valore di inizializzazione di controllo, è necessario rielaborare la struttura.
Se successivamente si desidera modificare la quantità di dati di testing o training, è possibile modificare le proprietà HoldoutMaxCases e HoldoutMaxPercent nella struttura di data mining utilizzando la finestra Proprietà. Tuttavia, dopo avere apportato la modifica è necessario rielaborare la struttura di data mining e tutti i modelli di data mining associati. Vengono applicate anche le seguenti limitazioni:
Il partizionamento di una struttura di data mining è supportato solo quando la struttura di data mining è archiviata in SQL Server 2008. Le versioni precedenti di SQL Server Analysis Services non supportano il caching delle informazioni sulle partizioni per le strutture di data mining.
Non è possibile partizionare una struttura di data mining se contiene una colonna Key Time, necessaria per i modelli di data mining della serie temporale.
Non è possibile partizionare i dati se si sta tentando di stimare un valore archiviato in una tabella nidificata.
Per ulteriori informazioni, vedere Convalida di modelli di data mining (Analysis Services - Data mining), Creazione di una nuova struttura di data mining, Esercitazione di base sul data mining
Opzioni
Percentuale di dati per il testing
Fare clic sulle frecce verso l'alto e verso il basso per aumentare o ridurre la percentuale di dati da utilizzare come set di training oppure digitare un valore compreso tra 0 e 100 nella casella di testo.Numero massimo di case nel set di dati
Digitare un numero per limitare il numero di case che possono essere utilizzati per il testing.Se si specifica un numero superiore al numero effettivo di case nei dati, verranno utilizzati tutti i case.
Il valore predefinito è NULL. Ciò significa che non sono presenti limiti.
Vedere anche