SystemGetClusterCrossValidationResults (Analysis Services - Data mining)
Si applica a: SQL Server 2019 e versioni precedenti di Analysis Services Azure Analysis Services Fabric/Power BI Premium
Importante
Il data mining è stato deprecato in SQL Server 2017 Analysis Services e ora è stato interrotto in SQL Server 2022 Analysis Services. La documentazione non viene aggiornata per le funzionalità deprecate e non più disponibili. Per altre informazioni, vedere Compatibilità con le versioni precedenti di Analysis Services.
Partiziona la struttura di data mining nel numero specificato di sezioni incrociate, esegue il training di un modello per ogni partizione, quindi restituisce la metrica di accuratezza per ogni partizione.
Nota Questa stored procedure può essere usata solo con una struttura di data mining contenente almeno un modello di clustering. Per convalidare i modelli non clustering, è necessario usare SystemGetCrossValidationResults (Analysis Services - Data Mining).
Sintassi
SystemGetClusterCrossValidationResults(
<structure name>,
[,<mining model list>]
,<fold count>}
,<max cases>
<test list>])
Argomenti
struttura di data mining
Nome di una struttura di data mining nel database corrente.
(obbligatorio)
mining model list
Elenco delimitato da virgole dei modelli di data mining da convalidare.
Se non si specifica un elenco di modelli di data mining, la convalida incrociata viene eseguita su tutti i modelli di clustering associati alla struttura specificata.
Nota
Per convalidare tra i modelli che non sono modelli di clustering, è necessario usare una stored procedure separata, SystemGetCrossValidationResults (Analysis Services - Data Mining).
(facoltativo).
conteggio di riduzione
Valore integer che specifica il numero di partizioni in cui separare il set di dati. Il valore minimo è 2. Il numero massimo di riduzioni è il numero intero massimo o il numero di case, a seconda di quale valore è inferiore.
Ogni partizione conterrà approssimativamente questo numero di casi: numero massimo di casi/di piegatura.
Non è previsto alcun valore predefinito.
Nota
Il numero di riduzioni influisce in modo significativo sul tempo richiesto per l'esecuzione della convalida incrociata. Se si seleziona un numero troppo elevato, l'esecuzione della query potrebbe richiedere molto tempo e in alcuni casi potrebbe verificarsi il blocco o il timeout del server.
(obbligatorio)
numero massimo di case
Valore integer che specifica il numero massimo di case che è possibile sottoporre a test.
Il valore 0 indica che verranno utilizzati tutti i case nell'origine dati.
Se si specifica un numero maggiore del numero effettivo di case presenti nel set di dati, verranno utilizzati tutti i case nell'origine dati.
(obbligatorio)
test list
Stringa che specifica le opzioni di testing.
Nota Questo parametro è riservato per usi futuri.
(facoltativo).
Tipo restituito
La tabella dei tipi restituiti contiene i punteggi per ogni singola partizione e le aggregazioni per tutti i modelli.
Nella tabella seguente vengono descritte le colonne restituite.
Nome colonna | Descrizione |
---|---|
ModelName | Nome del modello sottoposto a test. |
AttributeName | Nome della colonna stimabile. Per i modelli del cluster, è sempre null. |
AttributeState | Valore di destinazione specificato nella colonna stimabile. Per i modelli di cluster, sempre Null. |
PartitionIndex | Indice in base 1 che identifica la partizione a cui si applicano i risultati. |
PartitionSize | Valore integer che indica il numero di case inclusi in ogni partizione. |
Test | Tipo di test eseguito. |
Misura | Nome della misura restituita dal test. Le misure per ogni modello dipendono dal tipo del valore stimabile. Per una definizione di ogni misura, vedere Convalida incrociata (Analysis Services - Data Mining). Per un elenco delle misure restituite per ogni tipo stimabile, vedere Misure nel report di convalida incrociata. |
Valore | Valore della misura di test specificata. |
Commenti
Per restituire metriche di accuratezza per l'intero set di dati, usare SystemGetClusterAccuracyResults (Analysis Services - Data Mining).
Inoltre, se il modello di data mining è già stato partizionato in piega, è possibile ignorare l'elaborazione e restituire solo i risultati della convalida incrociata usando SystemGetClusterAccuracyResults (Analysis Services - Data Mining).
Esempio
Nell'esempio seguente viene illustrato come partizionare una struttura di data mining per la convalida incrociata in tre riduzioni, quindi come sottoporre a test due modelli di clustering associati alla struttura di data mining.
Nella terza riga del codice sono specificati i modelli di data mining che si desidera sottoporre a test. Se non si specifica l'elenco, vengono utilizzati tutti i modelli di clustering associati alla struttura.
Nella quarta riga del codice è specificato il numero di riduzioni, mentre nella quinta riga è specificato il numero massimo di case da utilizzare.
Poiché si tratta di modelli di clustering, non è necessario specificare un attributo o un valore stimabile.
CALL SystemGetClusterCrossValidationResults(
[v Target Mail],
[Cluster 1], [Cluster 2],
3,
10000
)
Risultati dell'esempio:
ModelName | AttributeName | AttributeState | PartitionIndex | PartitionSize | Test | Misura | Valore |
---|---|---|---|---|---|---|---|
Cluster 1 | 1 | 3025 | Clustering | Probabilità del case | 0.930524511864121 | ||
Cluster 1 | 2 | 3025 | Clustering | Probabilità del case | 0.919184178430778 | ||
Cluster 1 | 3 | 3024 | Clustering | Probabilità del case | 0.929651120490248 | ||
Cluster 2 | 1 | 1289 | Clustering | Probabilità del case | 0.922789726933607 | ||
Cluster 2 | 2 | 1288 | Clustering | Probabilità del case | 0.934865535691068 | ||
Cluster 2 | 3 | 1288 | Clustering | Probabilità del case | 0.924724595688798 |
Requisiti
La convalida incrociata è disponibile solo in SQL Server Enterprise a partire da SQL Server 2008.
Vedere anche
SystemGetCrossValidationResults (Analysis Services - Data mining)
SystemGetAccuracyResults (Analysis Services - Data mining)
SystemGetClusterCrossValidationResults
SystemGetClusterAccuracyResults (Analysis Services - Data mining)