Aplicar Operação Matemática
Este artigo descreve um componente do designer do Azure Machine Learning.
Use a Operação Aplicar Matemática para criar cálculos que são aplicados a colunas numéricas no conjunto de dados de entrada.
As operações matemáticas incluem funções aritméticas, funções trigonométricas, funções de arredondamento e funções especiais usadas na ciência de dados, como funções gama e de erro.
Depois de definir uma operação e executar o pipeline, os valores são adicionados ao seu conjunto de dados. Dependendo de como você configura o componente, você pode:
- Anexe os resultados ao seu conjunto de dados (útil ao verificar o resultado da operação).
- Substitua os valores das colunas pelos novos valores calculados.
- Gere uma nova coluna para os resultados e não mostre os dados originais.
Procure a operação que você precisa nestas categorias:
-
As funções na categoria Basic podem ser usadas para manipular um único valor ou coluna de valores. Por exemplo, você pode obter o valor absoluto de todos os números em uma coluna ou calcular a raiz quadrada de cada valor em uma coluna.
-
As funções na categoria Comparar são todas usadas para comparação: você pode fazer uma comparação em pares dos valores em duas colunas ou pode comparar cada valor em uma coluna com uma constante especificada. Por exemplo, você pode comparar colunas para determinar se os valores eram os mesmos em dois conjuntos de dados. Ou, você pode usar uma constante, como um valor máximo permitido, para encontrar valores atípicos em uma coluna numérica.
-
A categoria Operações inclui funções matemáticas básicas: adição, subtração, multiplicação e divisão. Você pode trabalhar com colunas ou constantes. Por exemplo, você pode adicionar o valor na Coluna A ao valor na Coluna B. Ou, você pode subtrair uma constante, como uma média calculada anteriormente, de cada valor na Coluna A.
-
A categoria Arredondamento inclui uma variedade de funções para realizar operações como arredondamento, teto, piso e truncamento para vários níveis de precisão. Você pode especificar o nível de precisão para números decimais e inteiros.
-
A categoria Especial inclui funções matemáticas que são especialmente usadas em ciência de dados, como integrais elípticas e a função de erro Gaussiano.
-
A categoria trigonométrica inclui todas as funções trigonométricas padrão. Por exemplo, você pode converter radianos em graus, ou computar funções como tangente em radianos ou graus. Essas funções são unárias, o que significa que elas tomam uma única coluna de valores como entrada, aplicam a função trigonométrica e retornam uma coluna de valores como resultado. Certifique-se de que a coluna de entrada é o tipo apropriado e contém o tipo correto de valores para a operação especificada.
Como configurar a operação Apply Math
O componente Apply Math Operation requer um conjunto de dados que contenha pelo menos uma coluna contendo apenas números. Os números podem ser discretos ou contínuos, mas devem ser de um tipo de dados numéricos, não de uma cadeia de caracteres.
Você pode aplicar a mesma operação a várias colunas numéricas, mas todas as colunas devem estar no mesmo conjunto de dados.
Cada instância desse componente pode executar apenas um tipo de operação de cada vez. Para executar operações matemáticas complexas, talvez seja necessário encadear várias instâncias do componente Apply Math Operation .
Adicione o componente Apply Math Operation ao seu pipeline.
Conecte um conjunto de dados que contenha pelo menos uma coluna numérica.
Selecione uma ou mais colunas de origem nas quais executar o cálculo.
- Qualquer coluna escolhida deve ser um tipo de dados numérico.
- O intervalo de dados deve ser válido para a operação matemática selecionada. Caso contrário, pode ocorrer um erro ou resultado NaN (não um número). Por exemplo, Ln(-1.0) é uma operação inválida e resulta em um valor de
NaN
.
Selecione Categoria para selecionar o tipo de operação matemática a ser executada.
Escolha uma operação específica na lista dessa categoria.
Defina parâmetros adicionais exigidos por cada tipo de operação.
Use a opção Modo de saída para indicar como você deseja que a operação matemática seja gerada:
- Anexar. Todas as colunas usadas como entradas são incluídas no conjunto de dados de saída, além de uma coluna adicional ser acrescentada que contém os resultados da operação matemática.
- No local. Os valores nas colunas usadas como entradas são substituídos pelos novos valores calculados.
- ResultOnly. Uma única coluna é retornada contendo os resultados da operação matemática.
Envie o pipeline.
Resultados
Se você gerar os resultados usando as opções Append ou ResultOnly , os cabeçalhos de coluna do conjunto de dados retornado indicarão a operação e as colunas que foram usadas. Por exemplo, se você comparar duas colunas usando o operador Equals , os resultados terão esta aparência:
- Igual(Col2_Col1), indicando que você testou Col2 contra Col1.
- Igual a (Col2_$10), indicando que você comparou a coluna 2 com a constante 10.
Mesmo se você usar a opção No local , os dados de origem não serão excluídos ou alterados, a coluna no conjunto de dados original ainda estará disponível no designer. Para exibir os dados originais, você pode conectar o componente Adicionar colunas e associá-lo à saída de Aplicar operação matemática.
Operações matemáticas básicas
As funções na categoria Basic geralmente tomam um único valor de uma coluna, executam a operação predefinida e retornam um único valor. Para algumas funções, você pode especificar uma constante ou um conjunto de colunas como um segundo argumento.
O Azure Machine Learning suporta as seguintes funções na categoria Básico :
Abs
Devolve o valor absoluto das colunas selecionadas.
Atan2
Devolve uma tangente inversa de quatro quadrantes.
Selecione as colunas que contêm as coordenadas do ponto. Para o segundo argumento, que corresponde à coordenada x, você também pode especificar uma constante.
Corresponde à função ATAN2 no MATLAB.
Conj
Retorna o conjugado para os valores na coluna selecionada.
CubeRoot
Calcula a raiz do cubo para os valores na coluna selecionada.
DuploFatorial
Calcula o fatorial duplo para valores na coluna selecionada. O duplo fatorial é uma extensão da função fatorial normal, e é denotado como x!!
.
Eps
Devolve o tamanho da lacuna entre o valor atual e o número de precisão dupla mais elevado seguinte. Corresponde à função EPS no MATLAB.
Exp
Retorna e elevado à potência do valor na coluna selecionada. Esta função é a mesma que a função EXP do Excel.
Exp2
Devolve o exponencial de base 2 dos argumentos, resolvendo por y = x * 2t onde t é uma coluna de valores contendo expoentes.
Em Conjunto de colunas, selecione a coluna que contém os valores expoentes t.
Para Exp2 , você pode especificar um segundo argumento x, que pode ser uma constante ou outra coluna de valores. Em Segundo tipo de argumento, indique se você fornecerá o multiplicador x como uma constante ou um valor em uma coluna.
Por exemplo, se você selecionar uma coluna com os valores {0,1,2,3,4,5} para o multiplicador e o expoente, a função retornará {0, 2, 8, 24, 64 160).
ExpMinus1
Devolve o expoente negativo para valores na coluna selecionada.
Fatorial
Devolve o fatorial para valores na coluna selecionada.
Hipotenusa
Calcula a hipotenusa para um triângulo no qual o comprimento de um lado é especificado como uma coluna de valores, e o comprimento do segundo lado é especificado como uma constante ou como duas colunas.
Ln
Devolve o logaritmo natural dos valores na coluna selecionada.
LnPlus1
Devolve o logaritmo natural mais um para os valores na coluna selecionada.
Registo
Retorna o log dos valores na coluna selecionada, dada a base especificada.
Você pode especificar a base (o segundo argumento) como uma constante ou selecionando outra coluna de valores.
Log10
Devolve os valores de base de 10 logaritmos para a coluna selecionada.
Log2
Devolve os valores de base de 2 logaritmos para a coluna selecionada.
NthRoot
Retorna a enésima raiz do valor, usando um n que você especificar.
Selecione as colunas para as quais você deseja calcular a raiz, usando a opção ColumnSet .
Em Segundo tipo de argumento, selecione outra coluna que contenha a raiz ou especifique uma constante a ser usada como raiz.
Se o segundo argumento for uma coluna, cada valor na coluna será usado como o valor de n para a linha correspondente. Se o segundo argumento for uma constante, digite o valor de n na caixa de texto Segundo argumento.
Pow
Calcula X elevado à potência de Y para cada um dos valores na coluna selecionada.
Primeiro, selecione as colunas que contêm a base, que deve ser um float, usando a opção ColumnSet .
Em Segundo tipo de argumento, selecione a coluna que contém o expoente ou especifique uma constante a ser usada como expoente.
Se o segundo argumento for uma coluna, cada valor na coluna será usado como expoente para a linha correspondente. Se o segundo argumento for uma constante, digite o valor do expoente na caixa de texto Segundo argumento.
Sqrt
Retorna a raiz quadrada dos valores na coluna selecionada.
SqrtPi
Para cada valor na coluna selecionada, multiplica o valor por pi e, em seguida, retorna a raiz quadrada do resultado.
Square
Quadra os valores na coluna selecionada.
Operações de comparação
Use as funções de comparação no designer do Azure Machine Learning sempre que precisar testar dois conjuntos de valores um contra o outro. Por exemplo, em um pipeline, talvez seja necessário fazer estas operações de comparação:
- Avalie um modelo de coluna de pontuações de probabilidade em relação a um valor limite.
- Determine se dois conjuntos de resultados são iguais. Para cada linha diferente, adicione um sinalizador FALSE que pode ser usado para processamento ou filtragem posteriores.
EqualTo
Retorna True se os valores forem os mesmos.
GreaterThan
Retorna True se os valores no conjunto de colunas forem maiores que a constante especificada ou maiores que os valores correspondentes na coluna de comparação.
MaiorThanOrEqualTo
Retorna True se os valores no conjunto de colunas forem maiores ou iguais à constante especificada, ou maiores ou iguais aos valores correspondentes na coluna de comparação.
LessThan
Retorna True se os valores no conjunto de colunas forem menores que a constante especificada ou menores que os valores correspondentes na coluna de comparação.
LessThanOrEqualTo
Retorna True se os valores no conjunto de colunas forem menores ou iguais à constante especificada, ou menores ou iguais aos valores correspondentes na coluna de comparação.
NotEqualTo
Retorna True se os valores no conjunto Column não forem iguais à constante ou coluna de comparação e retorna False se forem iguais.
Par Max
Retorna o valor maior — o valor no conjunto de colunas ou o valor na constante ou na coluna de comparação.
PairMin
Devolve o valor que é menor — o valor no conjunto de colunas ou o valor na constante ou coluna de comparação
Operações aritméticas
Inclui as operações aritméticas básicas: adição e subtração, divisão e multiplicação. Como a maioria das operações é binária, exigindo dois números, você primeiro escolhe a operação e, em seguida, escolhe a coluna ou números a serem usados no primeiro e no segundo argumentos.
A ordem de divisão e subtração é a seguinte:
- Subtrair(Arg1_Arg2) = Arg1 - Arg 2
- Divisão(Arg1_Arg2) = Arg1 / Arg 2
A tabela a seguir mostra alguns exemplos
Operação | Núm1 | Núm2 | Coluna de resultados | Valor do resultado |
---|---|---|---|---|
Adição | 1 | 5 | Adicionar(Num2_Num1) | 6 |
Multiplicação | 1 | 5 | Múltiplo(Num2_Num1) | 5 |
Subtração | 5 | 1 | Subtrair(Num2_Num1) | 4 |
Subtração | 0 | 1 | Subtrair(Num2_Num1) | -1 |
Divisão | 5 | 1 | Dividir(Num2_Num1) | 5 |
Divisão | 1 | 0 | Dividir(Num2_Num1) | Infinity |
Adicionar
Especifique as colunas de origem usando Conjunto de colunas e, em seguida, adicione a esses valores um número especificado em Segundo argumento.
Para adicionar os valores em duas colunas, escolha uma coluna ou colunas usando Conjunto de colunas e, em seguida, escolha uma segunda coluna usando Segundo argumento.
Dividir
Divide os valores em Coluna definidos por uma constante ou pelos valores de coluna definidos no segundo argumento. Em outras palavras, você escolhe primeiro o divisor e, em seguida, o dividendo. O valor de saída é o quociente.
Multiplicar
Multiplica os valores em Coluna definidos pelos valores de constante ou coluna especificados.
Subtract
Especifique a coluna de valores em que operar (o minuend), escolhendo uma coluna diferente, usando a opção Conjunto de colunas. Em seguida, especifique o número a ser subtraído (o subtrahend) usando a lista suspensa Segundo argumento. Você pode escolher uma constante ou uma coluna de valores.
Operações de arredondamento
O designer do Azure Machine Learning dá suporte a uma variedade de operações de arredondamento. Para muitas operações, você deve especificar a quantidade de precisão a ser usada ao arredondar. Você pode usar um nível de precisão estático, especificado como uma constante, ou pode aplicar um valor de precisão dinâmica obtido de uma coluna de valores.
Se você usar uma constante, defina Tipo de precisão como Constante e, em seguida, digite o número de dígitos como um inteiro na caixa de texto Precisão constante . Se você digitar um número não inteiro, o componente não gerará um erro, mas os resultados podem ser inesperados.
Para usar um valor de precisão diferente para cada linha do conjunto de dados, defina Tipo de Precisão como ColumnSet e escolha a coluna que contém os valores de precisão apropriados.
Ceiling
Devolve o limite máximo para os valores em Conjunto de colunas.
Potência Teto2
Retorna o teto quadrado para os valores no conjunto de colunas.
Piso
Retorna o piso para os valores no conjunto de colunas, com a precisão especificada.
Mod
Retorna a parte fracionária dos valores no conjunto de colunas, com a precisão especificada.
Quociente
Retorna a parte fracionária dos valores no conjunto de colunas, com a precisão especificada.
Resto
Retorna o restante para os valores no conjunto de colunas.
Dígitos redondos
Devolve os valores no conjunto de colunas, arredondados pela regra 4/5 para o número especificado de dígitos.
RoundDown
Devolve os valores no conjunto de colunas, arredondados para baixo para o número especificado de dígitos.
RoundUp
Devolve os valores em Conjunto de colunas, arredondados para o número especificado de dígitos.
Toeven
Devolve os valores em Conjunto de colunas, arredondados para o número par inteiro mais próximo.
ToOdd
Devolve os valores em Conjunto de colunas, arredondados para o número ímpar inteiro mais próximo.
Truncar
Trunca os valores no conjunto de colunas removendo todos os dígitos não permitidos pela precisão especificada.
Funções matemáticas especiais
Esta categoria inclui funções matemáticas especializadas frequentemente usadas em ciência de dados. Salvo indicação em contrário, a função é unária e retorna o cálculo especificado para cada valor na coluna ou colunas selecionadas.
Beta
Devolve o valor da função beta de Euler.
ElípticaIntegralE
Devolve o valor da integral elíptica incompleta.
ElípticaIntegralK
Devolve o valor da integral elíptica completa (K).
Erf
Retorna o valor da função de erro.
A função de erro (também chamada de função de erro de Gauss) é uma função especial da forma sigmoide que é usada em probabilidade para descrever a difusão.
Erfc
Devolve o valor da função de erro complementar.
Erfc
é definido como 1 – ERF(x).
ErfScaled
Retorna o valor da função de erro dimensionada.
A versão em escala da função de erro pode ser usada para evitar subfluxo aritmético.
ErfInverse
Devolve o valor da função inversa erf
.
ExponencialIntegralEin
Devolve o valor da integral exponencial Ei.
Gama
Devolve o valor da função gama.
GammaLn
Devolve o logaritmo natural da função gama.
GamaRegularizadoP
Devolve o valor da função gama incompleta regularizada.
Esta função usa um segundo argumento, que pode ser fornecido como uma constante ou uma coluna de valores.
GammaRegularizedPInverse
Devolve o valor da função gama incompleta regularizada inversamente.
Esta função usa um segundo argumento, que pode ser fornecido como uma constante ou uma coluna de valores.
GammaRegularizedQ
Devolve o valor da função gama incompleta regularizada.
Esta função usa um segundo argumento, que pode ser fornecido como uma constante ou uma coluna de valores.
GammaRegularizedQInverse
Devolve o valor da função gama incompleta regularizada generalizada inversa.
Esta função usa um segundo argumento, que pode ser fornecido como uma constante ou uma coluna de valores.
Poligama
Devolve o valor da função polygamma.
Esta função usa um segundo argumento, que pode ser fornecido como uma constante ou uma coluna de valores.
Funções trigonométricas
Esta categoria iInclui a maioria das importantes funções trigonométricas e trigonométricas inversas. Todas as funções trigonométricas são unárias e não requerem argumentos adicionais.
Acos
Calcula o arco cosseno para os valores da coluna.
AcosDegree
Calcula o arco cosseno dos valores da coluna, em graus.
Acosh
Calcula o arco hiperbólico dos valores da coluna.
Acot
Calcula o arco cotangente dos valores da coluna.
AcotGraus
Calcula a arccotangente dos valores da coluna, em graus.
Acoth
Calcula o arco cotangente hiperbólico dos valores da coluna.
ACSC
Calcula o arcossecante dos valores da coluna.
AcscDegrees
Calcula o arcossecante dos valores da coluna, em graus.
Asec
Calcula o arco secante dos valores da coluna.
AsecDegrees
Calcula o arco secante dos valores da coluna, em graus.
Asech
Calcula o arcosecante hiperbólico dos valores da coluna.
Asin
Calcula o arco seno dos valores da coluna.
AsinGraus
Calcula o arco seno dos valores da coluna, em graus.
Asinh
Calcula o arco hiperbólico para os valores da coluna.
Atan
Calcula o arco tangente dos valores da coluna.
AtanDegrees
Calcula o arco tangente dos valores da coluna, em graus.
Atanh
Calcula o arco tangente hiperbólico dos valores da coluna.
Cos
Calcula o cosseno dos valores da coluna.
CosDegrees
Calcula o cosseno para os valores da coluna, em graus.
Cosh
Calcula o cosseno hiperbólico para os valores da coluna.
Cot
Calcula a cotangente para os valores da coluna.
CotDegrees
Calcula a cotangente para os valores da coluna, em graus.
Coth
Calcula a cotangente hiperbólica para os valores da coluna.
CSC
Calcula a cossecante para os valores da coluna.
CscDegrees
Calcula a cossecante para os valores da coluna, em graus.
Csch
Calcula a cossecante hiperbólica para os valores da coluna.
GrausToRadians
Converte graus em radianos.
Sec.
Calcula a secante dos valores da coluna.
aSecGraus
Calcula a secante para os valores da coluna, em graus.
aSech
Calcula a secante hiperbólica dos valores da coluna.
Assinar
Devolve o sinal dos valores da coluna.
Sin
Calcula o seno dos valores da coluna.
Sinc
Calcula o valor seno-cosseno dos valores da coluna.
SinDegrees
Calcula o seno para os valores da coluna, em graus.
Sinh
Calcula o seno hiperbólico dos valores da coluna.
Tan
Calcula a tangente dos valores da coluna.
TanDegrees
Calcula a tangente para o argumento, em graus.
Tanh
Calcula a tangente hiperbólica dos valores da coluna.
Notas técnicas
Tenha cuidado ao selecionar mais de uma coluna como segundo operador. Os resultados são fáceis de entender se a operação for simples, como adicionar uma constante a todas as colunas.
Suponha que seu conjunto de dados tenha várias colunas e você adicione o conjunto de dados a si mesmo. Nos resultados, cada coluna é adicionada a si mesma, da seguinte forma:
Núm1 | Núm2 | Núm3 | Adicionar(Num1_Num1) | Adicionar(Num2_Num2) | Adicionar(Num3_Num3) |
---|---|---|---|---|---|
1 | 5 | 2 | 2 | 10 | 4 |
2 | 3 | -1 | 4 | 6 | -2 |
0 | 1 | -1 | 0 | 2 | -2 |
Se você precisar executar cálculos mais complexos, poderá encadear várias instâncias de Apply Math Operation. Por exemplo, você pode adicionar duas colunas usando uma instância de Apply Math Operation e, em seguida, usar outra instância de Apply Math Operation para dividir a soma por uma constante para obter a média.
Como alternativa, use um dos seguintes componentes para fazer todos os cálculos de uma só vez, usando script SQL, R ou Python:
Próximos passos
Consulte o conjunto de componentes disponíveis para o Azure Machine Learning.