Spaltenverteilungen (Data Mining)
In MicrosoftSQL ServerAnalysis Services können Sie Spaltenverteilungen in einer Miningstruktur definieren, um zu beeinflussen, wie Algorithmen die Daten in diesen Spalten verarbeiten, wenn Sie Miningmodelle erstellen. Für einige Algorithmen ist es hilfreich, vor dem Verarbeiten des Modells für jede kontinuierliche Spalte die Verteilung zu definieren, wenn für die Spalten bekannt ist, dass sie normal verteilte Werte enthalten. Wenn Sie die Verteilungen nicht definieren, liefern die sich ergebenden Miningmodelle möglicherweise ungenauere Vorhersagen, da die Algorithmen weniger Informationen zum Interpretieren der Daten haben.
Die in Analysis Services verfügbaren Algorithmen unterstützen folgende Verteilungstypen:
Normal
Die Werte für die kontinuierliche Spalte bilden ein Histogramm, das einer Normalverteilung folgt.Log Normal
Die Werte für die kontinuierliche Spalte bilden ein Histogramm, in dem die Kurve am oberen Ende einen gedehnten Verlauf und am unteren Ende einen Schrägverlauf aufweist.Uniform
Die Werte für die kontinuierliche Spalte bilden eine flache Kurve, in der alle Werte gleich wahrscheinlich sind.
Weitere Informationen zu den Algorithmen, die in Analysis Services zur Verfügung stehen, finden Sie unter Data Mining-Algorithmen (Analysis Services - Data Mining).
Siehe auch