Поделиться через


Распределения столбцов (интеллектуальный анализ данных)

В Microsoft SQL Server Analysis Services можно определить распределения столбцов в структуре интеллектуального анализа данных, чтобы повлиять на то, как алгоритмы обрабатывают данные в этих столбцах при создании моделей интеллектуального анализа данных. В некоторых алгоритмах лучше задавать распределение для всех столбцов, содержащих непрерывные данные, до начала обработки модели в случае, если указанные столбцы содержат общие распределения значений. Если распределения не заданы, создаваемые модели интеллектуального анализа данных могут работать менее точно, чем модели с заданными распределениями, так как на вход алгоритмов будет подаваться меньшее количество данных для анализа.

Алгоритмы, доступные в службах Analysis Services, поддерживают следующие типы распределения:

Normal Значения для непрерывного столбца образуют гистограмму с нормальным распределением.

Гистограмма с нормальным распределением

Log Normal Значения для непрерывного столбца образуют гистограмму, где кривая вытянута в верхнем конце и наклоняется к нижнему концу.

Гистограмма с нормальным распределением по журналам

Uniform Значения для непрерывного столбца образуют плоскую кривую, в которой все значения одинаково вероятны.

Гистограмма с однородным распределением

Дополнительные сведения об алгоритмах, предоставляемых службами Analysis Services, см. в статье Алгоритмы интеллектуального анализа данных (службы Analysis Services — интеллектуальный анализ данных).

См. также:

Типы контента (интеллектуальный анализ данных)Структуры интеллектуального анализа данных (службы Analysis Services — интеллектуальный анализ данных)Методы дискретизации (интеллектуальный анализ данных)Распределения (DMX)Столбцы структуры интеллектуального анализа данных