Распределения столбцов (интеллектуальный анализ данных)
В Microsoft SQL Server Analysis Services можно определить распределения столбцов в структуре интеллектуального анализа данных, чтобы повлиять на то, как алгоритмы обрабатывают данные в этих столбцах при создании моделей интеллектуального анализа данных. В некоторых алгоритмах лучше задавать распределение для всех столбцов, содержащих непрерывные данные, до начала обработки модели в случае, если указанные столбцы содержат общие распределения значений. Если распределения не заданы, создаваемые модели интеллектуального анализа данных могут работать менее точно, чем модели с заданными распределениями, так как на вход алгоритмов будет подаваться меньшее количество данных для анализа.
Алгоритмы, доступные в службах Analysis Services, поддерживают следующие типы распределения:
Normal
Значения для непрерывного столбца образуют гистограмму с нормальным распределением.
Log Normal
Значения для непрерывного столбца образуют гистограмму, где кривая вытянута в верхнем конце и наклоняется к нижнему концу.
Uniform
Значения для непрерывного столбца образуют плоскую кривую, в которой все значения одинаково вероятны.
Дополнительные сведения об алгоритмах, предоставляемых службами Analysis Services, см. в статье Алгоритмы интеллектуального анализа данных (службы Analysis Services — интеллектуальный анализ данных).
См. также:
Типы контента (интеллектуальный анализ данных)Структуры интеллектуального анализа данных (службы Analysis Services — интеллектуальный анализ данных)Методы дискретизации (интеллектуальный анализ данных)Распределения (DMX)Столбцы структуры интеллектуального анализа данных