Distribuzioni delle colonne (Data mining)
In Microsoft SQL Server Analysis Services è possibile definire le distribuzioni di colonne in una struttura di data mining per influire sul modo in cui gli algoritmi elaborano i dati in tali colonne quando si creano modelli di data mining. Per alcuni algoritmi è utile definire la distribuzione dei dati nelle colonne continue prima di elaborare il modello, se è noto che tali colonne contengono valori con distribuzioni comuni. Se non si definiscono le distribuzioni, i modelli di data mining risultanti possono produrre stime meno accurate, perché gli algoritmi dispongono di meno informazioni per l'interpretazione dei dati.
Gli algoritmi disponibili in Analysis Services supportano i tipi di distribuzione seguenti:
Normal
I valori per la colonna continua formano un istogramma con una distribuzione normale.
Log Normal
I valori per la colonna continua formano un istogramma, dove la curva è allungata alla fine superiore ed è asimmetria verso la fine inferiore.
distribuzione
Uniform
I valori per la colonna continua formano una curva piatta, in cui tutti i valori sono altrettanto probabili.
Per altre informazioni sugli algoritmi forniti da Analysis Services, vedere Algoritmi di data mining (Analysis Services - Data mining).
Vedere anche
Tipi di contenuto (data mining)Strutture di data mining (Analysis Services - Data Mining)Metodi di discretizzazione (data mining)Distribuzioni (DMX)Colonne della struttura di data mining