Алгоритм линейной регрессии (Microsoft)
Алгоритм линейной регрессии (Microsoft) представляет собой разновидность алгоритма дерева принятия решений (Microsoft), где параметр MINIMUM_LEAF_CASES больше или равен общему количеству вариантов в наборе данных, который алгоритм использует для обучения модели интеллектуального анализа данных. Если параметр задан таким способом, то алгоритм не будет выполнять разбиение, то есть не будет выполнять линейную регрессию.
Линейную регрессию можно использовать для определения связи между двумя непрерывными столбцами. Связь принимает вид формулы линии, представляющей ряд данных. Например, линия на следующей диаграмме является наилучшим линейным представлением данных.
Формула, представляющая линию на диаграмме, принимает вид y = ax + b и известна как уравнение регрессии. Переменная Y представляет выходную переменную, X — входную переменную, a и b — изменяемые коэффициенты. Каждой точке на диаграмме соответствует ошибка, связанная с ее расстоянием от линии регрессии. Коэффициенты a и b в уравнении регрессии регулируют угол и положение линии регрессии. Можно получать уравнение регрессии с помощью подбора коэффициентов a и b до тех пор, пока сумма ошибок, связанных с этими точками, не будет минимальной.
Использование алгоритма
Для просмотра модели интеллектуального анализа с линейной регрессией используйте средство просмотра дерева (Microsoft).
Модель линейной регрессии должна содержать ключевой столбец, входные столбцы и хотя бы один прогнозируемый столбец.
Алгоритм линейной регрессии (Microsoft) поддерживает типы содержимого входных столбцов, прогнозируемых столбцов и флагов моделирования, перечисленных в следующей таблице.
Типы содержимого входных столбцов |
Continuous, Cyclical, Key, Table и Ordered |
Типы содержимого прогнозируемых столбцов |
Continuous, Cyclical и Ordered |
Флаги моделирования |
NOT NULL и REGRESSOR |
Все алгоритмы Microsoft поддерживают общий набор функций. Однако алгоритм линейной регрессии (Microsoft) поддерживает дополнительные функции, список которых приведен в следующей таблице.
|
Список функций, общих для всех алгоритмов Microsoft, см. в разделе Алгоритмы интеллектуального анализа данных. Дополнительные сведения об использовании этих функций см. в разделе Ссылка на функцию расширений интеллектуального анализа данных.
Алгоритм линейной регрессии (Microsoft) поддерживает несколько параметров, которые влияют на производительность и точность итоговой модели интеллектуального анализа данных. В следующей таблице содержатся описания всех параметров.
Параметр | Описание |
---|---|
MAXIMUM_INPUT_ATTRIBUTES |
Определяет количество входных атрибутов, которые алгоритм может обработать перед вызовом выбора компонентов. Установите значение 0, чтобы отключить выбор компонентов. Значение по умолчанию равно 255. |
MAXIMUM_OUTPUT_ATTRIBUTES |
Определяет количество выходных атрибутов, которые алгоритм может обработать перед вызовом выбора компонентов. Установите значение 0, чтобы отключить выбор компонентов. Значение по умолчанию равно 255. |
FORCED_REGRESSOR |
Приводит алгоритм к использованию указанных столбцов в качестве регрессоров, не обращая внимания на важность столбцов, вычисленную алгоритмом. |
См. также
Основные понятия
Алгоритмы интеллектуального анализа данных
Мастер интеллектуального анализа данных
Выбор компонентов в интеллектуальном анализе данных
Просмотр модели интеллектуального анализа данных с помощью средства просмотра деревьев (Microsoft)
Другие ресурсы
CREATE MINING MODEL (расширения интеллектуального анализа данных)