Spaltenverteilungen [Data Mining]
In Microsoft SQL Server Analysis Services können Sie Spaltenverteilungen in einer Miningstruktur definieren, um die Verarbeitung der Daten in diesen Spalten durch Algorithmen beim Erstellen von Miningmodellen zu beeinflussen. Für einige Algorithmen ist es hilfreich, vor dem Verarbeiten des Modells für jede kontinuierliche Spalte die Verteilung zu definieren, wenn für die Spalten bekannt ist, dass sie normal verteilte Werte enthalten. Wenn Sie die Verteilungen nicht definieren, liefern die sich ergebenden Miningmodelle möglicherweise ungenauere Vorhersagen, da die Algorithmen weniger Informationen zum Interpretieren der Daten haben.
Die in Analysis Services verfügbaren Algorithmen unterstützen die folgenden Verteilungstypen:
Normal
Die Werte für die fortlaufende Spalte bilden ein Histogramm mit normaler Verteilung.
Log Normal
Die Werte für die fortlaufende Spalte bilden ein Histogramm, wobei die Kurve am oberen Ende langgestreckt und zum unteren Ende verzerrt ist.
Uniform
Die Werte für die fortlaufende Spalte bilden eine flache Kurve, in der alle Werte gleich wahrscheinlich sind.
Weitere Informationen zu den Algorithmen, die Analysis Services bereitstellt, finden Sie unter Data Mining-Algorithmen (Analysis Services – Data Mining).
Weitere Informationen
Inhaltstypen (Data Mining)Miningstrukturen (Analysis Services - Data Mining)Diskretisierungsmethoden (Data Mining)Verteilungen (DMX)Miningstrukturspalten