Spaltenverteilungen [Data Mining]

Artikel
06/13/2017

In Microsoft SQL Server Analysis Services können Sie Spaltenverteilungen in einer Miningstruktur definieren, um die Verarbeitung der Daten in diesen Spalten durch Algorithmen beim Erstellen von Miningmodellen zu beeinflussen. Für einige Algorithmen ist es hilfreich, vor dem Verarbeiten des Modells für jede kontinuierliche Spalte die Verteilung zu definieren, wenn für die Spalten bekannt ist, dass sie normal verteilte Werte enthalten. Wenn Sie die Verteilungen nicht definieren, liefern die sich ergebenden Miningmodelle möglicherweise ungenauere Vorhersagen, da die Algorithmen weniger Informationen zum Interpretieren der Daten haben.

Die in Analysis Services verfügbaren Algorithmen unterstützen die folgenden Verteilungstypen:

Normal Die Werte für die fortlaufende Spalte bilden ein Histogramm mit normaler Verteilung.

Histogramm mit Normalverteilung

Log Normal Die Werte für die fortlaufende Spalte bilden ein Histogramm, wobei die Kurve am oberen Ende langgestreckt und zum unteren Ende verzerrt ist.

Histogramm mit Protokoll-Normalverteilung

Uniform Die Werte für die fortlaufende Spalte bilden eine flache Kurve, in der alle Werte gleich wahrscheinlich sind.

Histogramm mit gleichmäßiger Verteilung

Weitere Informationen zu den Algorithmen, die Analysis Services bereitstellt, finden Sie unter Data Mining-Algorithmen (Analysis Services – Data Mining).

Weitere Informationen

Inhaltstypen (Data Mining)Miningstrukturen (Analysis Services - Data Mining)Diskretisierungsmethoden (Data Mining)Verteilungen (DMX)Miningstrukturspalten

Freigeben über

Spaltenverteilungen [Data Mining]

Weitere Informationen

Zusätzliche Ressourcen