Применение математической операции
Важно!
Поддержка Студии машинного обучения (классической) будет прекращена 31 августа 2024 г. До этой даты рекомендуется перейти на Машинное обучение Azure.
Начиная с 1 декабря 2021 года вы не сможете создавать новые ресурсы Студии машинного обучения (классической). Существующие ресурсы Студии машинного обучения (классическая версия) можно будет использовать до 31 августа 2024 г.
- См. сведения о перемещении проектов машинного обучения из ML Studio (классической) в Машинное обучение Azure.
- См. дополнительные сведения о Машинном обучении Azure.
Поддержка документации по ML Studio (классической) прекращается, а сама документация может не обновляться в будущем.
Применяет математическую операцию к значениям столбцов
Категория: статистические функции
Примечание
применимо к: только Машинное обучение Studio (классическая модель)
Подобные модули перетаскивания доступны в конструкторе машинного обучения Azure.
Обзор модуля
в этой статье описывается использование модуля Apply Math Operation в Машинное обучение Studio (классическая модель) для создания вычислений, которые применяются к числовым столбцам входного набора данных.
Поддерживаемые математические операции включают в себя общие арифметические функции, такие как умножение и деление, тригонометрические функции, различные функции округления и специальные функции, используемые в обработке и обработке данных, например в функциях гаммы и ошибок.
После определения операции и запуска эксперимента значения добавляются в набор данных. В зависимости от настройки модуля можно:
- Добавьте результаты в набор данных. Это особенно полезно при проверке результата операции.
- заменить значения столбцов новыми, вычисленными значениями;
- создать новый столбец для результатов без отображения исходных данных.
Совет
Этот модуль выполняет одну математическую операцию за раз. Для сложных математических операций рекомендуется использовать эти модули.
Найдите необходимую операцию в следующих категориях:
-
Функции из категории Базовые можно использовать для управления одним значением или столбцом значений. Например, можно получить абсолютное значение всех чисел в столбце или вычислить квадратный корень каждого значения в столбце.
-
Функции из категории Сравнение используются для сравнения: можно выполнить попарное сравнение значений в двух столбцах или сравнить каждое значение в столбце с заданной константой. Например, можно сравнить столбцы, чтобы определить, совпадают ли значения в двух наборах данных. Или же для поиска выбросов в числовом столбце можно использовать константу, например максимальное допустимое значение.
-
Эта категория включает основные математические функции: сложение, вычитание, умножение и деление. Можно работать с любыми столбцами или константами. Например, можно добавить значение столбца A к значению столбца B. Или можно вычесть константу, например ранее вычисленное среднее значение, из каждого значения в столбце A.
-
Эта категория включает различные функции для выполнения таких операций, как округление, вырезание, этаж и усечение, до различных уровней точности. Можно указать уровень точности как для десятичных, так и для целых чисел.
специальные математические функции.
Категория Специальные содержит математические функции, которые особенно используются в обработке и анализе данных, такие как эллиптические интегралы и функция обработки ошибок по Гауссу.
-
В эту категорию входят все стандартные тригонометрические функции. Например, можно преобразовывать радианы в градусы или вычислять такие функции, как тангенс, в радианах или градусах. Эти функции являются унарными, то есть принимают один столбец значений в качестве входных данных, применяют тригонометрическую функцию и возвращают столбец значений в качестве результата. Поэтому необходимо убедиться, что входной столбец имеет соответствующий тип и содержит правильный тип значений для указанной операции.
Примеры
Примеры использования операции Apply Mathсм. в этих примерах экспериментов в Коллекция решений ии Azure.
Цвет дискретизация: один набор значений столбца вычитается из другого, а затем результаты вычитаются по квадрату.
Прогнозирование отношений с клиентами. константа 1 добавляется ко всем значениям в столбце, чтобы различать нули и отсутствующие значения.
Прогноз задержки рейсов: демонстрирует различные операции, включая округление и деление.
Прямой маркетинг: использует операции сравнения, чтобы определить, соответствуют ли показатели вероятности требуемому значению.
Использование операции Apply Math
Модулю Применение математической операции требуется набор данных, в котором имеется хотя бы один столбец, содержащий только цифры. Числа могут быть дискретными или непрерывными, но должны иметь числовой тип данных, а не тип строки.
Одну и ту же операцию можно применить к нескольким числовым столбцам, но все столбцы должны находиться в одном наборе данных.
Каждый экземпляр этого модуля может выполнять только один тип операции за один раз. Для выполнения сложных математических операций может потребоваться объединить несколько экземпляров модуля Применение математической операции.
Добавьте модуль Apply Math Operation (применить математическую операцию ) к вашему эксперименту. Этот модуль можно найти в категории статистические функции .
Подключите набор данных, содержащий хотя бы один числовой столбец.
Щелкните Категория , чтобы выбрать тип математических операций для выполнения.
Например, чтобы выполнить базовые арифметические действия со столбцами, выберите операции. Чтобы получить логарифм или потолк, выберите базовый. Для сравнения столбцов значений используйте Сравнение.
Совет
Все остальные параметры изменяются в зависимости от выбранного типа математической операции. Кроме того, любое изменение в категории приводит к сбросу всех остальных параметров. Поэтому обязательно выберите вариант сначала из категории .
Выберите конкретную операцию из списка в этой категории.
Выберите один или несколько исходных столбцов, над которыми необходимо выполнить вычисление.
- Любой выбранный столбец должен иметь числовой тип данных.
- Диапазон данных должен быть допустимым для выбранной математической операции. В противном случае может возникнуть ошибка или будет получен результат NaN ("не число"). Например, Ln(-1.0) является недопустимой операцией и приводит к значению
NaN
.
Задайте дополнительные параметры, необходимые для каждого типа операций.
С помощью параметра Режим вывода укажите, как будет создана математическая операция:
- Append. Все столбцы, используемые как входные данные, включаются в выходной набор данных, а также добавляется один дополнительный столбец, содержащий результаты математической операции.
- Inplace (замещение). Значения в столбцах, используемых в качестве входных данных, заменяются новыми вычисляемыми значениями.
- ResultOnly (только результат). Возвращается один столбец, содержащий результаты математической операции.
Запустите эксперимент или щелкните правой кнопкой мыши только модуль Apply Math Operation (применить математическую операцию ) и выберите пункт Выполнить выбранное.
Результаты
При формировании результатов с помощью параметров Append или ResultOnly заголовки столбцов возвращаемого набора данных указывают на операцию и столбцы, которые были использованы. Например, если сравнить два столбца с помощью оператора Equals, результаты будут выглядеть следующим образом:
- Equals (Col2_Col1), что означает, что вы тестировали Col2 на col1.
- Equals (Col2_ $10) указывает, что столбец 2 сравнивался с константой 10.
Даже если используется параметр « заменить », исходные данные не удаляются и не изменяются. столбец в исходном наборе данных по-прежнему доступен в студии (классическая модель). Чтобы просмотреть исходные данные, можно подключить модуль Добавление столбцов и присоединить его к выходным данным модуля Применение математической операции.
Базовые математические операции.
Функции категории Базовые обычно принимают одно значение из столбца, выполняют предопределенную операцию и возвращают одно значение. Для некоторых функций можно указать константу в качестве второго аргумента.
Машинное обучение поддерживает следующие функции в категории " базовый ":
Abs
Возвращает абсолютное значение выбранных столбцов.
Atan2
Возвращает арктангенс двух переменных.
Выберите столбцы, содержащие координаты точек. Для второго аргумента, который соответствует координате x, можно также указать константу.
Соответствует функции ATAN2 в Matlab.
Conj
Возвращает сопряжение для значений в выбранном столбце.
CubeRoot
Вычисляет кубический корень для значений в выбранном столбце.
Даублефакториал * *
Вычисляет двойной факториал для значений в выбранном столбце. Двойной факториал — это расширение обычной функции факториала, которое обозначается как x!!.
Eps
Возвращает разницу между текущим значением и следующим наибольшим числом двойной точности. Соответствует функции EPS в Matlab.
Exp
Возвращает значение e, возведенное в степень значения выбранного столбца. это то же самое, что и функция Excel EXP.
Exp2
Возвращает экспоненту по основанию 2 для аргументов по формуле y = x * 2t, где t — столбец значений, содержащих экспоненты.
Для Exp2 можно указать второй аргумент x, который может быть либо константой, либо другим столбцом значений.
В поле второй тип аргументаукажите, следует ли предоставлять множитель t как константу или значение в столбце.
Можно выбрать один столбец со значениями экспоненты или ввести значение экспоненты в текстовое поле постоянный второй аргумент . Затем в наборе столбцоввыберите столбец, содержащий значения экспоненты.
Например, если выбрать столбец со значениями {0,1,2,3,4,5} в качестве как множителя, так и экспоненты, функция вернет {0, 2, 8, 24, 64, 160).
ExpMinus1
Возвращает отрицательную экспоненту для значений в выбранном столбце.
Факториал
Возвращает факториал для значений в выбранном столбце.
Hypotenuse
Вычисляет гипотенузу для треугольника, в котором длина одной стороны задается в виде столбца значений, а длина второй стороны указывается либо как константа, либо как два столбца.
ImaginaryPart
Возвращает мнимые части значений в выбранном столбце.
Натуральный логарифм
Возвращает натуральный логарифм для значений в выбранном столбце.
LnPlus1
Возвращает натуральный логарифм плюс единицу для значений в выбранном столбце.
Журнал
Возвращает логарифм значений в выбранном столбце по заданному основанию.
Можно указать основание (второй аргумент) либо как константу, либо выбрав другой столбец значений.
Log10
Возвращает основание 10 логарифма значений в выбранном столбце.
Log2
Возвращает логарифм по основанию 2 для значений в выбранном столбце.
NthRoot
Извлекает корень n-й степени из значения, используя в качестве n указанное вами число.
Выберите столбцы, для которых требуется вычислить корень, с помощью параметра ColumnSet.
В поле Тип второго аргумента укажите другой столбец, содержащий корень, или константу, которая будет использоваться в качестве корня.
Если второй аргумент представляет собой столбец, каждое значение в этом столбце используется как значение n для соответствующей строки. Если второй аргумент является константой, введите значение n в текстовом поле постоянный второй аргумент .
Pow
Вычисляет значение X, возведенное в степень Y для каждого из значений в выбранном столбце.
Сначала выберите столбцы, содержащие базовоезначение, которое должно быть числом с плавающей запятой с помощью параметра «набор столбцов ».
В поле Тип второго аргумента укажите столбец, содержащий показатель степени, или константу, которая будет использоваться в качестве показателя.
Если в качестве типа второго аргумента выбран столбец, каждое значение в столбце используется как показатель степени для соответствующей строки. Если в качестве типа второго аргумента выбрана константа, введите значение для показателя степени в текстовом поле Второй аргумент-константа.
RealPart
Возвращает реальную часть значений в выбранном столбце.
Sqrt
Возвращает квадратный корень значений в выбранном столбце.
SqrtPi
Для каждого значения в выбранном столбце умножает значение на число пи, а затем возвращает квадратный корень результата.
Square
Возводит значения в выбранном столбце в квадрат.
операции сравнения;
используйте функции сравнения в Машинное обучение Studio (классическая модель) каждый раз, когда необходимо проверить два набора значений по отношению друг к другу. Например, в эксперименте может потребоваться выполнить следующие операции сравнения:
- Оценить столбец модели показателей вероятности по пороговому значению.
- Определите, совпадают ли два набора результатов, и для каждой строки, которая отличается, добавьте флаг FALSE, который можно использовать для дальнейшей обработки или фильтрации.
EqualTo
Возвращает значение True, если значения одинаковы.
GreaterThan
Возвращает значение True, если значения в наборе столбцов больше указанной константы или больше соответствующих значений в столбце сравнения.
GreaterThanOrEqualTo
Возвращает значение True, если значения в наборе столбцов больше или равны указанной константе, или же больше или равны соответствующим значениям в столбце сравнения.
LessThan;
Возвращает значение True, если значения в наборе столбцов меньше указанной константы или меньше соответствующих значений в столбце сравнения.
LessThanOrEqualTo
Возвращает значение True, если значения в наборе столбцов меньше или равны указанной константе, или же меньше или равны соответствующим значениям в столбце сравнения.
NotEqualTo
Возвращает значение True, если значения, заданные в поле Набор столбцов, не равны константе или значениям в столбце сравнения, и значение False в противном случае.
PairMax
Возвращает значение, которое больше, — значение в Наборе столбцов или значение в столбце констант или сравнения.
PairMin
Возвращает меньшее значение: значение в наборе столбцов или значение константы либо столбца сравнения.
Арифметические операции
Включает базовые арифметические операции: сложение и вычитание, деление и умножение. Большинство операций являются бинарными, которым требуются два числа, поэтому сначала следует выбрать операцию, а затем столбец или числа, которые будут использоваться в первом и втором аргументах.
Порядок выбора столбцов для деления и вычитания может показаться нелогичнымм; Однако, чтобы упростить понимание результатов, заголовок столбца содержит имя операции и порядок, в котором были использованы столбцы.
Операция | Num1 | Num2 | Столбец результатов | Значение результата |
---|---|---|---|---|
Сложение | 1 | 5 | Add(Num2_Num1) | 4 |
Умножение | 1 | 5 | Multiple(Num2_Num1) | 5 |
Вычитание | 1 | 5 | Subtract(Num2_Num1) | 4 |
Вычитание | 0 | 1 | Subtract(Num2_Num1) | 0 |
Отдел | 1 | 5 | Divide(Num2_Num1) | 5 |
Отдел | 0 | 1 | Divide(Num2_Num1) | Infinity |
Добавить
Укажите исходные столбцы с помощью набора столбцов, а затем добавьте к этим значениям число, указанное в аргументе постоянной операции.
Чтобы добавить значения в два столбца, выберите столбец или столбцы с помощью набора столбцов, а затем выберите второй столбец с помощью аргумента операции.
Divide
Делит значения в наборе столбцов на константу или значения столбца, заданные в качестве аргумента операции. Иными словами, сначала нужно выбрать делитель, а затем делимое. Выходное значение является частным.
Multiply
Умножает значения в наборе столбцов на указанную константу или значения столбца.
Subtract
Укажите число для вычитания ( subtrahend) с помощью раскрывающегося списка аргумент операции . Можно выбрать либо константу, либо столбец значений. Затем укажите столбец значений для работы ( minuend), выбрав другой столбец, используя второй параметр набора столбцов .
Можно вычесть константу из каждого значения в столбце значений, но не в обратной операции. Для этого используйте вместо этого сложение.
Операции округления
Studio (классическая модель) поддерживает различные операции округления. Для многих операций необходимо указать величину точности, используемую при округлении. Можно использовать статический уровень точности, заданный в виде константы, или применить динамическое значение точности, полученное из столбца значений.
При использовании константы задайте Тип точностиКонстанта, а затем введите количество цифр в виде целого числа в текстовом поле Точность константы. Если ввести не целое число, модуль не выдаст ошибку, но результаты могут быть неожиданными.
Чтобы использовать другое значение точности для каждой строки в наборе данных, установите Тип точностиColumnSet, а затем выберите столбец, содержащий соответствующие значения точности.
Ceiling
Возвращает наибольшее значение в наборе столбцов.
CeilingPower2
Возвращает квадрат наибольшего значения в наборе столбцов.
Этаж
Возвращает наименьшее значение в наборе столбцов с заданной точностью.
Mod
Возвращает наименьшую дробную часть значения в наборе столбцов с заданной точностью.
Знаменатель
Возвращает наименьшую дробную часть значения в наборе столбцов с заданной точностью.
Остаток
Возвращает остаток для значений в наборе столбцов.
RoundDigits
Возвращает значения в наборе столбцов, округленные до указанного количества цифр по правилу 4/5.
RoundDown
Возвращает значения в наборе столбцов, округленные к меньшему значению с указанной точностью.
RoundUp
Возвращает значения в наборе столбцов, округленные к большему значению с указанной точностью.
ToEven
Возвращает значения в Наборе столбцов, округленные до ближайшего целого четного числа.
ToOdd
Возвращает значения в Наборе столбцов, округленные до ближайшего целого нечетного числа.
Truncate
Усекает значения, заданные в Наборе столбцов, удаляя все цифры, которых не должно быть при заданной точности.
Специальные математические функции
В эту категорию входят специализированные математические функции, часто используемые в обработке и анализе данных. Если не указано иное, функция является унарной и возвращает заданное вычисление для каждого значения в выбранном столбце или столбцах.
Бета;
Возвращает значение бета-функции Эйлера.
EllipticIntegralE
Возвращает значение неполного эллиптического интеграла.
EllipticIntegralK
Возвращает значение полного эллиптического интеграла (K).
Erf
Возвращает значение функции ошибок.
Функция ошибок (также называемая функцией ошибок Гаусса) — это специальная сигмоидальная функция, которая используется для описания распределения вероятностей.
Erfc
Возвращает значение дополнительной функции ошибок.
Ерфк определяется как 1 – Фош (x).
ErfScaled
Возвращает значение нормированной функции ошибок.
Эту версию функции ошибок можно использовать во избежание потери точности арифметических вычислений.
ErfInverse
Возвращает значение обратной функции ошибок.
ExponentialIntegralEin
Возвращает значение интеграла показательной функции Ei.
Gamma
Возвращает значение гамма-функции.
GammaLn
Возвращает натуральный логарифм гамма-функции.
GammaRegularizedP
Возвращает значение регуляризованной неполной гамма-функции.
Эта функция принимает второй аргумент, который можно указать как константу или столбец значений.
GammaRegularizedPInverse
Возвращает значение обратной регуляризованной неполной гамма-функции.
Эта функция принимает второй аргумент, который можно указать как константу или столбец значений.
GammaRegularizedQ
Возвращает значение регуляризованной неполной гамма-функции.
Эта функция принимает второй аргумент, который можно указать как константу или столбец значений.
GammaRegularizedQInverse
Возвращает значение обратной обобщенной регуляризованной неполной гамма-функции.
Эта функция принимает второй аргумент, который можно указать как константу или столбец значений.
PolyGamma
Возвращает значение полигамма-функции.
Эта функция принимает второй аргумент, который можно указать как константу или столбец значений.
Тригонометрические функции
Эта категория включает в себя большинство тригонометрических и обратных тригонометрических функций. Все тригонометрические функции являются унарными и не требуют дополнительных аргументов.
Acos
Вычисляет арккосинус значений столбца.
AcosDegree
Вычисляет арккосинус значений столбца в градусах.
Acosh
Вычисляет гиперболический арккосинус значений столбца.
Acot
Вычисляет арккотангенс значений столбца.
AcotDegrees
Вычисляет арккотангенс значений столбца в градусах.
Acoth
Вычисляет гиперболический арккотангенс значений столбца.
Acsc
Вычисляет арккосеканс значений столбца.
AcscDegrees
Вычисляет арккосеканс значений столбца в градусах.
Asec
Вычисляет арксеканс значений столбца.
AsecDegrees
Вычисляет арксеканс значений столбца в градусах.
Asech
Вычисляет гиперболический арксеканс значений столбца.
Asin
Вычисляет арксинус значений столбца.
AsinDegrees
Вычисляет арксинус значений столбца в градусах.
Asinh
Вычисляет гиперболический арксинус значений столбца.
Atan
Вычисляет арктангенс значений столбца.
AtanDegrees
Вычисляет арктангенс значений столбца в градусах.
Atanh
Вычисляет гиперболический арктангенс значений столбца.
Cis
Возвращает функцию с множеством значений, сделанную от синуса и косинуса с определением CI θ = COS θ + ISIN θ.
Cos
Вычисляет косинус значений столбца.
CosDegrees
Вычисляет косинус значений столбца в градусах.
Cosh
Вычисляет гиперболический косинус значений столбца.
Cot
Вычисляет котангенс значений столбца.
CotDegrees
Вычисляет котангенс значений столбца в градусах.
Coth
Вычисляет гиперболический котангенс значений столбца.
Csc
Вычисляет косеканс значений столбца.
CscDegrees
Вычисляет косеканс значений столбца в градусах.
Csch
Вычисляет гиперболический косеканс значений столбца.
DegreesToRadians
Преобразует градусы в радианы.
Sec
Вычисляет секанс значений столбца.
aSecDegrees
Вычисляет секанс значений столбца в градусах.
aSech
Вычисляет гиперболический секанс значений столбца.
Sign
Возвращает знак значений столбца.
Sin
Вычисляет синус значений столбца.
Sinc
Вычисляет значение синус-косинус для значений столбца.
SinDegrees
Вычисляет синус значений столбца в градусах.
Sinh
Вычисляет гиперболический синус значений столбца.
Tan
Вычисляет тангенс значений столбца.
TanDegrees
Вычисляет тангенс аргумента в градусах.
Tanh
Вычисляет гиперболический тангенс значений столбца.
Технические примечания
В этом разделе содержатся сведения и советы относительно реализации, а также ответы на часто задаваемые вопросы.
Операции с несколькими столбцами
Будьте внимательны при выборе в качестве второго оператора более чем одного столбца. Результаты легко понять, если операция проста, например, добавление константы ко всем столбцам.
Предположим, что набор данных содержит несколько столбцов, и вы добавляете набор данных к самому себе. В результатах каждый столбец добавляется к самому себе следующим образом:
Num1 | Num2 | Num3 | Add(Num1_Num1) | Add(Num2_Num2) | Add(Num3_Num3) |
---|---|---|---|---|---|
1 | 5 | 2 | 2 | 10 | 4 |
2 | 3 | -1 | 4 | 6 | -2 |
0 | 1 | -1 | 0 | 2 | -2 |
Если необходимо выполнить более сложные вычисления, можно объединить в цепочку несколько экземпляров модуля Применение математической операции. Например, можно сложить два столбца с помощью одного экземпляра Применения математической операции, а затем с помощью другого экземпляра Применения математической операции разделить эту сумму на константу, чтобы получить среднее значение.
кроме того, можно использовать один из следующих модулей для выполнения всех вычислений одновременно, используя SQL, R или скрипт Python:
Унарные и бинарные функции
В унарной операциивычисления создаются на основе значений столбцов без обращения к другим столбцам или константам.
Например, можно усечь значения столбца до определенной степени точности, округлить значения в большую или меньшую сторону и найти ближайшее целое число при округлении в большую или меньшую сторону.
Примером унарной операции является Abs(X)
, где X — это входной столбец.
В бинарной операцииуказываются два набора значений. Первый аргумент всегда должен быть столбцом или набором столбцов, а второй аргумент может быть числом, указанным как константа, либо другим столбцом.
Примером бинарной операции с использованием двух столбцов является Subtract(X,Y)
, где X — первый выбранный столбец, а Y — второй.
Примером использования бинарной операции, выполняющей действия со столбцом и константой, может служить вычитание Subtract(X,mean)
, при котором вводится среднее значение столбца, являющееся константой, а затем это значение вычитается из каждого значения в столбце X.
Обработка чисел в столбцах категорий
Поддержка значений категорий, представленных в виде чисел, зависит от функции, а также от количества аргументов, принимаемых функцией.
Если операция включает числа, обозначенные как столбцы категорий, унарную операцию можно применить к значениям данных о категориях.
Если к столбцу категории применяется Унарная операция, то значения данных категории входного столбца могут быть преобразованы в значения данных, относящиеся к выходному столбцу. В этом случае значения объединяются, так что количество значений данных категории в выходах всегда меньше числа значений во входном параметре.
Если бинарная операция применяется к столбцу категорий и другому столбцу, ожидаемое поведение выглядит следующим образом:
Если другой столбец является плотным, тогда выходной столбец является категориальным.
Значения категориальных данных, присутствующие во входных данных, теряются.
Выходной столбец содержит только те значения, которые присутствуют в данных выходного столбца.
Если другой столбец является разреженным, тогда и выходной столбец является разреженным.
Если оба аргумента бинарной операции — разреженные столбцы, мы получим столбец, содержащий фоновые нули в тех же местах, где они находятся в обоих входных столбцах.
Обработка разреженных столбцов
В унарных операциях все элементы разреженных столбцов, соответствующие фоновым нулям, остаются необработанными.
В бинарных операциях, если один аргумент является разреженным, а второй аргумент является сжатым, результирующий столбец будет разреженным, и все фоновые нули распространяются от входных данных из разреженного столбца.
Ожидаемые входные данные
Имя | Тип | Описание |
---|---|---|
Dataset | Таблица данных | Входной набор данных |
Выходные данные
Имя | Тип | Описание |
---|---|---|
Набор данных результатов | Таблица данных | Набор данных результатов |