Aplicación de operación matemática
En este artículo se describe un componente del diseñador de Azure Machine Learning.
Use el módulo Aplicación de operación matemática para crear cálculos que se aplican a columnas numéricas del conjunto de datos de entrada.
Las operaciones matemáticas incluyen funciones aritméticas comunes, funciones trigonométricas, funciones de redondeo y funciones especiales que se usan en ciencia de datos, como funciones gamma y de error.
Después de definir una operación y ejecutar la canalización, los valores se agregan al conjunto de datos. En función de cómo configure el componente, puede:
- Anexar los resultados al conjunto de datos (útil para comprobar el resultado de la operación).
- Reemplazar valores de columna por los nuevos valores calculados.
- Generar una nueva columna para los resultados y no mostrar los datos originales.
Busque la operación que necesita en estas categorías:
-
Las funciones de la categoría Básicas se pueden usar para manipular un solo valor o una columna de valores. Por ejemplo, puede obtener el valor absoluto de todos los números de una columna o calcular la raíz cuadrada de cada valor de una columna.
-
Todas las funciones de la categoría Comparación se usan para establecer comparaciones: puede realizar una comparación por pares de los valores de dos columnas o puede comparar cada valor de una columna con una constante especificada. Por ejemplo, puede comparar columnas para determinar si los valores eran los mismos en dos conjuntos de datos. También puede usar una constante, como un valor máximo permitido, para buscar valores atípicos en una columna numérica.
-
La categoría Operaciones incluye las funciones matemáticas básicas: suma, resta, multiplicación y división. Puede trabajar con columnas o con constantes. Por ejemplo, puede sumar el valor de la columna A al valor de la columna B. También puede restar una constante, como una media calculada previamente, de cada valor de la columna A.
-
La categoría Redondeo incluye una variedad de funciones para realizar operaciones como el redondeo, el valor superior, el valor inferior y el truncamiento a varios niveles de precisión. Puede especificar el nivel de precisión para números enteros y decimales.
-
La categoría Especiales incluye funciones matemáticas que se utilizan especialmente en ciencia de datos, como las integrales elípticas y la función de error gaussiana.
-
La categoría Trigonométricas incluye todas las funciones trigonométricas estándar. Por ejemplo, puede convertir radianes en grados o funciones de cálculo como una tangente en radianes o grados. Estas funciones son unarias, lo que significa que toman una sola columna de valores como entrada, aplican la función trigonométrica y devuelven una columna de valores como resultado. Asegúrese de que la columna de entrada sea del tipo adecuado y contenga el tipo correcto de valores para la operación especificada.
Configuración del módulo Aplicación de operación matemática
El componente Apply Math Operation (Aplicación de operación matemática) requiere un conjunto de datos que tenga al menos una columna que solo contenga números. Los números pueden ser discretos o continuos, pero deben ser de tipo de datos numérico, no una cadena.
Puede aplicar la misma operación a varias columnas numéricas, pero todas las columnas deben estar en el mismo conjunto de datos.
Cada instancia de este componente puede realizar un solo tipo de operación cada vez. Para realizar operaciones matemáticas complejas, es posible que tenga que encadenar varias instancias del componente Apply Math Operation (Aplicación de operación matemática).
Agregue el componente Apply Math Operation (Aplicación de operación matemática) a la canalización.
Conecte un conjunto de datos que contenga al menos una columna numérica.
Seleccione una o varias columnas de origen en las que realizar el cálculo.
- Cualquier columna que elija debe ser de tipo de datos numérico.
- El intervalo de datos debe ser válido para la operación matemática seleccionada. De lo contrario, puede producirse un error o un resultado NaN (no es un número). Por ejemplo, Ln(-1,0) es una operación no válida y da como resultado un valor de
NaN
.
Seleccione Category (Categoría) para seleccionar el tipo de operación matemática que realizar.
Elija una operación específica de la lista de esa categoría.
Establezca los parámetros adicionales que requiera cada tipo de operación.
Utilice la opción Output mode (Modo de salida) para indicar cómo desea que se genere la operación matemática:
- Append. Todas las columnas que se usan como entradas se incluyen en el conjunto de datos de salida, además de anexarse una columna adicional que contiene los resultados de la operación matemática.
- Inplace (Reemplazo). Los valores de las columnas que se usan como entradas se reemplazan por los nuevos valores calculados.
- ResultOnly (Solo resultado). Se devuelve una sola columna que contiene los resultados de la operación matemática.
Envíe la canalización.
Results
Si genera los resultados con las opciones Append (Anexión) o ResultOnly (Solo resultado), los encabezados de columna del conjunto de datos devuelto indican la operación y las columnas que se usaron. Por ejemplo, si compara dos columnas mediante el operador Equals (Es igual a), los resultados serían similares a los siguientes:
- Equals(Col2_Col1), que indica que ha contrastado la columna Col2 con Col1.
- Equals(Col2_$10), que indica que ha comparado la columna 2 con la constante 10.
Aunque use la opción Inplace, los datos de origen no se eliminan ni se cambian; la columna del conjunto de datos original sigue estando disponible en el diseñador. Para ver los datos originales, puede conectar el componente Agregar columnas y combinarlo con la salida de Apply Math Operation (Aplicación de operación matemática).
Operaciones matemáticas básicas
Las funciones de la categoría Básicas normalmente toman un único valor de una columna, realizan la operación predefinida y devuelven un único valor. Para algunas funciones, puede especificar una constante o un conjunto de columnas como segundo argumento.
Azure Machine Learning admite las siguientes funciones en la categoría Básicas:
Abs
Devuelve el valor absoluto de las columnas seleccionadas.
Atan2
Devuelve una tangente inversa de cuatro cuadrantes.
Seleccione las columnas que contienen las coordenadas de puntos. Para el segundo argumento, que corresponde a la coordenada x, también puede especificar una constante.
Corresponde a la función ATAN2 en MATLAB.
Conj
Devuelve el conjugado de los valores de la columna seleccionada.
CubeRoot
Calcula la raíz cúbica de los valores de la columna seleccionada.
DoubleFactorial
Calcula el doble factorial de los valores de la columna seleccionada. El factorial doble es una extensión de la función factorial normal y se indica con x!!
.
Eps
Devuelve el tamaño de la diferencia entre el valor actual y el siguiente número de doble precisión más alto. Corresponde a la función EPS en MATLAB.
Exp
Devuelve e elevado a la potencia del valor de la columna seleccionada. Esta función es igual que la función EXP de Excel.
Exp2
Devuelve el valor exponencial de base 2 de los argumentos, resolviendo para y = x * 2t, donde t es una columna de valores que contienen exponentes.
En Column set (Conjunto de columnas), seleccione la columna que contiene los valores de exponente t.
Para Exp2 puede especificar un segundo argumento x, que puede ser una constante u otra columna de valores. En Second argument type (Tipo de segundo argumento), indique si va a proporcionar el multiplicador x como constante o un valor en una columna.
Por ejemplo, si selecciona una columna con los valores {0,1,2,3,4,5} para el multiplicador y el exponente, la función devuelve {0, 2, 8, 24, 64 160).
ExpMinus1
Devuelve el exponente negativo para los valores de la columna seleccionada.
Factorial
Devuelve el factorial de los valores de la columna seleccionada.
Hypotenuse
Calcula la hipotenusa de un triángulo en el que la longitud de un lado se especifica como una columna de valores y la longitud del segundo lado se especifica como una constante o como dos columnas.
Lín
Devuelve el logaritmo natural de los valores de la columna seleccionada.
LnPlus1
Devuelve el logaritmo natural más uno de los valores de la columna seleccionada.
Log
Devuelve el logaritmo de los valores de la columna seleccionada, dada la base especificada.
Puede especificar la base (el segundo argumento) como una constante o seleccionando otra columna de valores.
Log10
Devuelve los valores del logaritmo de base 10 de la columna seleccionada.
Log2
Devuelve los valores del logaritmo de base 2 de la columna seleccionada.
NthRoot
Devuelve la radiación del valor con un número n que especifique.
Seleccione las columnas para las que desea calcular la raíz mediante la opción ColumnSet (Conjunto de columnas).
En Second argument type (Tipo de segundo argumento), seleccione otra columna que contenga la raíz o especifique una constante para usarla como raíz.
Si el segundo argumento es una columna, cada valor de la columna se usa como el valor de n para la fila correspondiente. Si el segundo argumento es una constante, escriba el valor de n en el cuadro de texto Second argument (Segundo argumento).
Pow
Calcula X elevado a la potencia de Y para cada uno de los valores de la columna seleccionada.
En primer lugar, seleccione las columnas que contengan la base, que debe ser un valor flotante, mediante la opción ColumnSet (Conjunto de columnas).
En Second argument type (Tipo de segundo argumento), seleccione la columna que contenga el exponente o especifique una constante para usarla como exponente.
Si el segundo argumento es una columna, cada valor de la columna se usa como el exponente para la fila correspondiente. Si el segundo argumento es una constante, escriba el valor del exponente en el cuadro de texto Second argument (Segundo argumento).
Sqrt
Devuelve la raíz cuadrada de los valores de la columna seleccionada.
SqrtPi
Para cada valor de la columna seleccionada, multiplica el valor por pi y, a continuación, devuelve la raíz cuadrada del resultado.
Square
Eleva al cuadrado los valores de la columna seleccionada.
Operaciones de comparación
Use las funciones de comparación del diseñador de Azure Machine Learning siempre que necesite contrastar dos conjuntos de valores. Por ejemplo, en una canalización podría necesitar realizar las siguientes operaciones de comparación:
- Evaluar una columna de modelo de puntuaciones de probabilidad con un valor de umbral.
- Determinar si dos conjuntos de resultados son iguales. Para cada fila que sea diferente, se agrega una marca FALSE, que puede resultar útil para posteriores operaciones de procesamiento o de filtrado.
EqualTo
Devuelve True si los valores son iguales.
GreaterThan
Devuelve True si los valores de Column set (Conjunto de columnas) son mayores que la constante especificada o mayores que los valores correspondientes de la columna de comparación.
GreaterThanOrEqualTo
Devuelve True si los valores de Column set (Conjunto de columnas) son mayores o iguales que la constante especificada o mayores o iguales que los valores correspondientes de la columna de comparación.
LessThan
Devuelve True si los valores de Column set (Conjunto de columnas) son menores que la constante especificada o menores que los valores correspondientes de la columna de comparación.
LessThanOrEqualTo
Devuelve True si los valores de Column set (Conjunto de columnas) son menores o iguales que la constante especificada o menores o iguales que los valores correspondientes de la columna de comparación.
NotEqualTo
Devuelve True si los valores del Conjunto de columnas no son iguales que la constante o la columna de comparación y devuelve False si lo son.
PairMax
Devuelve el valor mayor entre el valor del Conjunto de columnas o el valor de la columna de comparación o constante.
PairMin
Devuelve el valor que sea menor: el valor de Column set (Conjunto de columnas) o el valor de la constante o la columna de comparación.
Operaciones aritméticas
Incluye las operaciones aritméticas básicas: suma, resta, división y multiplicación. Dado que la mayoría de las operaciones son binarias, lo que requiere dos números, primero seleccionará la operación y, a continuación, elegirá la columna o los números que usar en el primer y el segundo argumento.
El orden de división y resta es el siguiente:
- Subtract(Arg1_Arg2) = Arg1 - Arg 2
- Divide(Arg1_Arg2) = Arg1 / Arg 2
En la tabla siguiente se muestran algunos ejemplos:
Operación | Num1 | Num2 | Columna de resultados | Valor del resultado |
---|---|---|---|---|
Suma | 1 | 5 | Add(Num2_Num1) | 6 |
Multiplicación | 1 | 5 | Multiple(Num2_Num1) | 5 |
Resta | 5 | 1 | Subtract(Num2_Num1) | 4 |
Resta | 0 | 1 | Subtract(Num2_Num1) | -1 |
División | 5 | 1 | Divide(Num2_Num1) | 5 |
División | 1 | 0 | Divide(Num2_Num1) | Infinity |
Sumar
Especifique las columnas de origen mediante Column set (Conjunto de columnas) y, a continuación, sume a esos valores un número especificado en Second argument (Segundo argumento).
Para sumar los valores de dos columnas, elija una columna o columnas mediante Column set (Conjunto de columnas) y, a continuación, seleccione una segunda columna mediante Second argument (Segundo argumento).
Dividir
Divide los valores de Column set (Conjunto de columnas) entre una constante o entre los valores de columna definidos en Second argument (Segundo argumento). En otras palabras, primero seleccionará el divisor y después el dividendo. El valor de salida es el cociente.
Multiplicar
Multiplica los valores del Conjunto de columnas por la constante o los valores de columna especificados.
Restar
Especifique la columna de valores en la que operar (el minuendo); para ello, elija una columna diferente mediante la opción Column set (Conjunto de columnas). A continuación, especifique el número que restar (el sustraendo) mediante la lista desplegable Second argument (Segundo argumento). Puede elegir una constante o una columna de valores.
Operaciones de redondeo
El diseñador de Azure Machine Learning admite diversas operaciones de redondeo. Para muchas operaciones, debe especificar la cantidad de precisión que se va a utilizar al redondear. Puede usar un nivel de precisión estática, especificado como una constante, o puede aplicar un valor de precisión dinámica obtenido a partir de una columna de valores.
Si usa una constante, establezca Precision Type (Tipo de precisión) en Constant (Constante) y, a continuación, escriba el número de dígitos como un entero en el cuadro de texto Constant Precision (Precisión de constante). Si escribe un valor no entero, el componente no genera un error, pero los resultados pueden ser inesperados.
Para usar un valor de precisión diferente para cada fila del conjunto de datos, establezca Precision Type en ColumnSet (Conjunto de columnas) y, a continuación, elija la columna que contiene los valores de precisión adecuados.
Ceiling
Devuelve el límite superior para los valores del Conjunto de columnas.
CeilingPower2
Devuelve el límite superior al cuadrado para los valores del Conjunto de columnas.
Floor
Devuelve el límite inferior para los valores del Conjunto de columnas con la precisión especificada.
Mod
Devuelve la parte fraccionaria de los valores del Conjunto de columnas con la precisión especificada.
Cociente
Devuelve la parte fraccionaria de los valores del Conjunto de columnas con la precisión especificada.
Resto
Devuelve el resto de los valores del Conjunto de columnas.
RoundDigits
Devuelve los valores del Conjunto de columnas redondeados por la regla 4/5 el número de dígitos especificado.
RoundDown
Devuelve los valores del Conjunto de columnas redondeados hacia abajo el número de dígitos especificado.
RoundUp
Devuelve los valores del Conjunto de columnasredondeados hacia arriba el número de dígitos especificado.
ToEven
Devuelve los valores del Conjunto de columnas redondeados al número par entero más próximo.
ToOdd
Devuelve los valores del Conjunto de columnas redondeados al número impar entero más próximo.
Truncate
Trunca los valores del Conjunto de columnas quitando todos los dígitos no permitidos por la precisión especificada.
Funciones matemáticas especiales
Esta categoría incluye funciones matemáticas especializadas que se suelen usar en ciencia de datos. A menos que se indique lo contrario, la función es unaria y devuelve el cálculo especificado para cada valor de la columna o columnas seleccionadas.
Beta
Devuelve el valor de la función beta de Euler.
EllipticIntegralE
Devuelve el valor de la integral elíptica incompleta.
EllipticIntegralK
Devuelve el valor de la integral elíptica completa (K).
Erf
Devuelve el valor de la función de error.
La función de error (también denominada función de error de Gauss) es una función especial de forma sigmoide que se usa en probabilidad para describir la difusión.
Erfc
Devuelve el valor de la función de error complementaria.
Erfc
se define como 1 – erf(x).
ErfScaled
Devuelve el valor de la función de error escalada.
La versión escalada de la función de error se puede usar para evitar el desbordamiento aritmético.
ErfInverse
Devuelve el valor de la función erf
inversa.
ExponentialIntegralEin
Devuelve el valor de la integral exponencial Ei.
Gamma
Devuelve el valor de la función gamma.
GammaLn
Devuelve el logaritmo natural de la función gamma.
GammaRegularizedP
Devuelve el valor de la función gamma incompleta regularizada.
Esta función toma un segundo argumento, que se puede proporcionar como una constante o como una columna de valores.
GammaRegularizedPInverse
Devuelve el valor de la función gamma incompleta regularizada inversa.
Esta función toma un segundo argumento, que se puede proporcionar como una constante o como una columna de valores.
GammaRegularizedQ
Devuelve el valor de la función gamma incompleta regularizada.
Esta función toma un segundo argumento, que se puede proporcionar como una constante o como una columna de valores.
GammaRegularizedQInverse
Devuelve el valor de la función gamma incompleta regularizada generalizada inversa.
Esta función toma un segundo argumento, que se puede proporcionar como una constante o como una columna de valores.
PolyGamma
Devuelve el valor de la función poligamma.
Esta función toma un segundo argumento, que se puede proporcionar como una constante o como una columna de valores.
Funciones trigonométricas
Esta categoría incluye la mayoría de las funciones trigonométricas y trigonométricas inversas importantes. Todas las funciones trigonométricas son unarias y no requieren ningún argumento adicional.
Acos
Calcula el arcocoseno de los valores de la columna.
AcosDegree
Calcula el arcocoseno de los valores de la columna en grados.
Acosh
Calcula el arcocoseno hiperbólico de los valores de la columna.
Acot
Calcula la arcocotangente de los valores de la columna.
AcotDegrees
Calcula la arcocotangente de los valores de la columna en grados.
Acoth
Calcula la arcocotangente hiperbólica de los valores de la columna.
Acsc
Calcula la arcocosecante de los valores de la columna.
AcscDegrees
Calcula la arcocosecante de los valores de la columna en grados.
Asec
Calcula la arcosecante de los valores de la columna.
AsecDegrees
Calcula la arcosecante de los valores de la columna en grados.
Asech
Calcula la arcosecante hiperbólica de los valores de la columna.
Asin
Calcula el arcoseno de los valores de la columna.
AsinDegrees
Calcula el arcoseno de los valores de la columna en grados.
Asinh
Calcula el arcoseno hiperbólico de los valores de la columna.
Atan
Calcula la arcotangente de los valores de la columna.
AtanDegrees
Calcula la arcotangente de los valores de la columna en grados.
Atanh
Calcula la arcotangente hiperbólica de los valores de la columna.
Cos
Calcula el coseno de los valores de la columna.
CosDegrees
Calcula el coseno de los valores de la columna en grados.
Cosh
Calcula el coseno hiperbólico de los valores de la columna.
Cot
Calcula la cotangente de los valores de la columna.
CotDegrees
Calcula la cotangente de los valores de la columna en grados.
Coth
Calcula la cotangente hiperbólica de los valores de la columna.
Csc
Calcula la cosecante de los valores de la columna.
CscDegrees
Calcula la cosecante de los valores de la columna en grados.
Csch
Calcula la cosecante hiperbólica de los valores de la columna.
DegreesToRadians
Convierte los grados en radianes.
Sec
Calcula la secante de los valores de la columna.
aSecDegrees
Calcula la secante de los valores de la columna en grados.
aSech
Calcula la secante hiperbólica de los valores de la columna.
Firma
Devuelve el signo de los valores de la columna.
Sin
Calcula el seno de los valores de la columna.
Sinc
Calcula el valor seno-coseno de los valores de la columna.
SinDegrees
Calcula el seno de los valores de la columna en grados.
Sinh
Calcula el seno hiperbólico de los valores de la columna.
Tan
Calcula la tangente de los valores de la columna.
TanDegrees
Calcula la tangente del argumento en grados.
Tanh
Calcula la tangente hiperbólica de los valores de la columna.
Notas técnicas
Tenga cuidado al seleccionar más de una columna como segundo operador. Los resultados son fáciles de entender si la operación es sencilla, como la suma de una constante a todas las columnas.
Supongamos que el conjunto de datos tiene varias columnas y que suma el conjunto de datos a sí mismo. En los resultados, cada columna se suma a sí misma, de la siguiente manera:
Num1 | Num2 | Num3 | Add(Num1_Num1) | Add(Num2_Num2) | Add(Num3_Num3) |
---|---|---|---|---|---|
1 | 5 | 2 | 2 | 10 | 4 |
2 | 3 | -1 | 4 | 6 | -2 |
0 | 1 | -1 | 0 | 2 | -2 |
Si necesita realizar cálculos más complejos, puede encadenar varias instancias del módulo Aplicación de operación matemática. Por ejemplo, podría agregar dos columnas mediante una instancia de Aplicar operación matemática y, a continuación, utilice otra instancia de Aplicar operación matemática para dividir la suma por una constante para obtener la media.
También puede usar uno de los siguientes componentes para realizar todos los cálculos a la vez, mediante un script de SQL, R o Python:
Pasos siguientes
Vea el conjunto de componentes disponibles para Azure Machine Learning.