Distribuzioni delle colonne (Data mining)

Articolo
06/13/2017

In Microsoft SQL Server Analysis Services è possibile definire le distribuzioni di colonne in una struttura di data mining per influire sul modo in cui gli algoritmi elaborano i dati in tali colonne quando si creano modelli di data mining. Per alcuni algoritmi è utile definire la distribuzione dei dati nelle colonne continue prima di elaborare il modello, se è noto che tali colonne contengono valori con distribuzioni comuni. Se non si definiscono le distribuzioni, i modelli di data mining risultanti possono produrre stime meno accurate, perché gli algoritmi dispongono di meno informazioni per l'interpretazione dei dati.

Gli algoritmi disponibili in Analysis Services supportano i tipi di distribuzione seguenti:

Normal I valori per la colonna continua formano un istogramma con una distribuzione normale.

Istogramma con distribuzione normale Istogramma con

Log Normal I valori per la colonna continua formano un istogramma, dove la curva è allungata alla fine superiore ed è asimmetria verso la fine inferiore.

Istogramma con un istogramma di distribuzione normale del log con distribuzione

Uniform I valori per la colonna continua formano una curva piatta, in cui tutti i valori sono altrettanto probabili.

Istogramma con istogramma di distribuzione uniforme con distribuzione uniforme

Per altre informazioni sugli algoritmi forniti da Analysis Services, vedere Algoritmi di data mining (Analysis Services - Data mining).

Vedere anche

Tipi di contenuto (data mining)Strutture di data mining (Analysis Services - Data Mining)Metodi di discretizzazione (data mining)Distribuzioni (DMX)Colonne della struttura di data mining

Condividi tramite

Distribuzioni delle colonne (Data mining)

Vedere anche

Risorse aggiuntive