Scegliere ed eseguire il mapping dei dati di test del modello
Per creare un grafico di accuratezza in Analysis Services, è necessario scegliere i dati che verranno usati per testare il modello e eseguire il mapping dei dati al modello.
Per impostazione predefinita, Analysis Services userà i dati di test del modello di data mining, purché sia stato creato un set di dati di blocco quando è stata creata la struttura di data mining. La creazione di un set di test di controllo rappresenta il modo più semplice per testare i modelli basati sulla stessa struttura di data mining perché i nomi delle colonne e i tipi di dati corrisponderanno sempre al modello e si può essere ragionevolmente certi che la distribuzione dei dati sia simile. Nella finestra di progettazione verranno inoltre create automaticamente le relazioni tra le colonne di input e le colonne del modello.
In alternativa, è possibile specificare un'origine esterna dei dati. Per i dati esterni, esistono alcuni requisiti aggiuntivi:
Il set di dati esterno deve essere definito come vista origine dati in un'istanza di Analysis Services.
Il set di dati esterno deve contenere almeno una colonna di cui sia possibile eseguire il mapping alla colonna stimabile del modello di data mining. È possibile scegliere di ignorare alcune colonne.
Non è possibile aggiungere nuove colonne o eseguire il mapping di colonne in una vista origine dati diversa. La vista origine dati selezionata deve contenere tutte le colonne necessarie per la query di stima.
Se i nomi delle colonne esterne corrispondono esattamente a quelli nel modello, il mapping verrà eseguito automaticamente. Se i mapping non sono corretti, è possibile modificarli o eliminare e creare nuovi mapping per colonne esistenti.
Se si utilizza un'origine dati esterna, è possibile applicare i filtri per limitare i dati di test a un subset attinente di case.
Anche quando si utilizza il set di test di controllo, è necessario ricordare che i filtri possono creare differenze tra i dati di test associati a una struttura di data mining e i test case del modello di data mining.
In questo argomento viene illustrato come scegliere ed eseguire il mapping dei dati di test:
Selezionare le tabelle di input per testare l'accuratezza di un modello di data mining
Eseguire il mapping delle colonne del modello alle colonne nei dati di test
Modificare il mapping delle colonne nei dati di test al modello
Per selezionare le tabelle di input per testare l'accuratezza di un modello di data mining
In Data Mining Designer in SQL Server Data Tools (SSDT), fare doppio clic sulla struttura di data mining che contiene i modelli da grafico.
Selezionare la scheda Grafico di accuratezza modello di data mining .
Nella scheda Selezione input della vista Grafico accuratezza modello di data mining selezionare una delle opzioni seguenti:
Utilizza test case del modello di data mining
Utilizza test case della struttura di data mining
Specifica un set di dati diverso
Se è stato selezionato Specifica un set di dati diverso, è possibile fare clic facoltativamente su Apri editor filtri per creare condizioni di filtro nei set di dati di input. Fare clic su OK.
Fare clic sulla scheda Grafico di accuratezza o Matrice di classificazione per compilare automaticamente il grafico utilizzando i dati di test specificati.
Per eseguire il mapping delle colonne del modello alle colonne nei dati di test
Fare doppio clic sulla struttura di data mining contenente i modelli per i quali creare il grafico per aprire la struttura e i modelli in Progettazione modelli di data mining.
Selezionare la scheda Grafico di accuratezza modello di data mining , quindi selezionare la scheda Selezione input .
Nell'area Seleziona set di dati da utilizzare per il grafico di accuratezza della scheda Selezione inputselezionare l'opzione Specifica un set di dati diverso.
Fare clic sul pulsante Sfoglia (...) per aprire una finestra di dialogo e compilare la definizione del set di dati esterno.
Nella finestra di dialogo Seleziona struttura di data mining selezionare la struttura di data mining contenente i modelli che si desidera utilizzare e quindi fare clic su OK.
Nella tabella Seleziona tabelle di input della scheda Grafico accuratezza modello di data mining fare clic su Seleziona tabella del case per aprire la finestra di dialogo Seleziona tabella .
Nella finestra di dialogo Seleziona tabella selezionare un'origine dati nell'elenco Origine dati . Scegliere una tabella contenente i dati che si desidera utilizzare nella query di stima per determinare l'accuratezza dei modelli.
Nella casella Nome tabella/vista selezionare la tabella contenente i dati che si desidera usare per testare i modelli.
Modificare i mapping, se necessario. Verrà automaticamente eseguito il mapping tra le colonne della struttura di data mining e le colonne con lo stesso nome incluse nella tabella di input. Per creare mapping manualmente, fare clic su una colonna nella tabella Seleziona tabelle di input e trascinarla sulla colonna corrispondente nella tabella Struttura di data mining . Per eliminare un mapping, fare clic sulla linea che collega la colonna contenuta nella tabella Struttura di data mining alla colonna contenuta nella tabella Seleziona tabelle di input , quindi premere CANC.
Fare clic su OK.
Per modificare il mapping dei dati di input al modello
In Progettazione modelli di data mining fare doppio clic sulla struttura che contiene i modelli di cui tracciare il grafico.
Selezionare la scheda Grafico di accuratezza modello di data mining .
Fare clic sulla scheda Selezione input .
In Selezionare il set di dati da usare per Il grafico di accuratezza selezionare l'opzione Specificare un set di dati diverso.
Fare clic sul pulsante Sfoglia (...) per aprire una finestra di dialogo e compilare la definizione dell'origine dati esterna.
Nella finestra di dialogo Specifica mapping colonne fare clic su Seleziona tabella del case.
Nella finestra di dialogo Seleziona tabella selezionare una vista origine dati nell'elenco, quindi la tabella che contiene i dati del case. Fare clic su OK.
Se le tabelle necessarie non sono disponibili, chiudere la finestra di dialogo e creare una nuova vista origine dati contenente la tabella. Per informazioni su come creare una vista origine dati, vedere Definizione di una vista origine dati (Analysis Services).
Se il modello di data mining contiene una tabella nidificata, fare clic su Seleziona tabella nidificata, quindi selezionare la tabella nidificata nell'elenco di tabelle nella vista origine dati. Fare clic su OK.
Selezionare la linea join del mapping che si desidera modificare, quindi fare clic su Modifica connessioni.
Verrà visualizzata la finestra di dialogo Modifica mapping . In questa finestra di dialogo è presente una tabella all'interno della quale la sezione Colonna struttura di data mining consente di visualizzare l'elenco delle colonne incluse nella struttura di data mining selezionata, mentre la sezione Colonna tabella consente di visualizzare le colonne delle tabelle di input sulle quali viene eseguito il mapping alle colonne della struttura di data mining.
In Colonna tabellaselezionare la riga corrispondente alla riga inclusa in Colonna struttura di data mining per cui si desidera modificare una relazione. Selezionare una nuova colonna nell'elenco oppure selezionare la voce vuota dell'elenco per eliminare la colonna.
Fare clic su OK.
I nuovi mapping delle colonna verranno visualizzati nella finestra di dialogo Specifica mapping colonne . È possibile rimuovere un mapping selezionando la linea tra le colonne e premendo CANC. È possibile creare una nuova connessione selezionando una colonna nella tabella Struttura di data mining , quindi trascinandola nella colonna corrispondente della tabella Seleziona tabelle di input .