Partilhar via


Aplicar Operação Matemática

Este artigo descreve um componente do designer do Azure Machine Learning.

Use a Operação Aplicar Matemática para criar cálculos que são aplicados a colunas numéricas no conjunto de dados de entrada.

As operações matemáticas incluem funções aritméticas, funções trigonométricas, funções de arredondamento e funções especiais usadas na ciência de dados, como funções gama e de erro.

Depois de definir uma operação e executar o pipeline, os valores são adicionados ao seu conjunto de dados. Dependendo de como você configura o componente, você pode:

  • Anexe os resultados ao seu conjunto de dados (útil ao verificar o resultado da operação).
  • Substitua os valores das colunas pelos novos valores calculados.
  • Gere uma nova coluna para os resultados e não mostre os dados originais.

Procure a operação que você precisa nestas categorias:

  • Básica

    As funções na categoria Basic podem ser usadas para manipular um único valor ou coluna de valores. Por exemplo, você pode obter o valor absoluto de todos os números em uma coluna ou calcular a raiz quadrada de cada valor em uma coluna.

  • Comparar

    As funções na categoria Comparar são todas usadas para comparação: você pode fazer uma comparação em pares dos valores em duas colunas ou pode comparar cada valor em uma coluna com uma constante especificada. Por exemplo, você pode comparar colunas para determinar se os valores eram os mesmos em dois conjuntos de dados. Ou, você pode usar uma constante, como um valor máximo permitido, para encontrar valores atípicos em uma coluna numérica.

  • Operações

    A categoria Operações inclui funções matemáticas básicas: adição, subtração, multiplicação e divisão. Você pode trabalhar com colunas ou constantes. Por exemplo, você pode adicionar o valor na Coluna A ao valor na Coluna B. Ou, você pode subtrair uma constante, como uma média calculada anteriormente, de cada valor na Coluna A.

  • Arredondamento

    A categoria Arredondamento inclui uma variedade de funções para realizar operações como arredondamento, teto, piso e truncamento para vários níveis de precisão. Você pode especificar o nível de precisão para números decimais e inteiros.

  • Especial

    A categoria Especial inclui funções matemáticas que são especialmente usadas em ciência de dados, como integrais elípticas e a função de erro Gaussiano.

  • Trigonométrico

    A categoria trigonométrica inclui todas as funções trigonométricas padrão. Por exemplo, você pode converter radianos em graus, ou computar funções como tangente em radianos ou graus. Essas funções são unárias, o que significa que elas tomam uma única coluna de valores como entrada, aplicam a função trigonométrica e retornam uma coluna de valores como resultado. Certifique-se de que a coluna de entrada é o tipo apropriado e contém o tipo correto de valores para a operação especificada.

Como configurar a operação Apply Math

O componente Apply Math Operation requer um conjunto de dados que contenha pelo menos uma coluna contendo apenas números. Os números podem ser discretos ou contínuos, mas devem ser de um tipo de dados numéricos, não de uma cadeia de caracteres.

Você pode aplicar a mesma operação a várias colunas numéricas, mas todas as colunas devem estar no mesmo conjunto de dados.

Cada instância desse componente pode executar apenas um tipo de operação de cada vez. Para executar operações matemáticas complexas, talvez seja necessário encadear várias instâncias do componente Apply Math Operation .

  1. Adicione o componente Apply Math Operation ao seu pipeline.

  2. Conecte um conjunto de dados que contenha pelo menos uma coluna numérica.

  3. Selecione uma ou mais colunas de origem nas quais executar o cálculo.

    • Qualquer coluna escolhida deve ser um tipo de dados numérico.
    • O intervalo de dados deve ser válido para a operação matemática selecionada. Caso contrário, pode ocorrer um erro ou resultado NaN (não um número). Por exemplo, Ln(-1.0) é uma operação inválida e resulta em um valor de NaN.
  4. Selecione Categoria para selecionar o tipo de operação matemática a ser executada.

  5. Escolha uma operação específica na lista dessa categoria.

  6. Defina parâmetros adicionais exigidos por cada tipo de operação.

  7. Use a opção Modo de saída para indicar como você deseja que a operação matemática seja gerada:

    • Anexar. Todas as colunas usadas como entradas são incluídas no conjunto de dados de saída, além de uma coluna adicional ser acrescentada que contém os resultados da operação matemática.
    • No local. Os valores nas colunas usadas como entradas são substituídos pelos novos valores calculados.
    • ResultOnly. Uma única coluna é retornada contendo os resultados da operação matemática.
  8. Envie o pipeline.

Resultados

Se você gerar os resultados usando as opções Append ou ResultOnly , os cabeçalhos de coluna do conjunto de dados retornado indicarão a operação e as colunas que foram usadas. Por exemplo, se você comparar duas colunas usando o operador Equals , os resultados terão esta aparência:

  • Igual(Col2_Col1), indicando que você testou Col2 contra Col1.
  • Igual a (Col2_$10), indicando que você comparou a coluna 2 com a constante 10.

Mesmo se você usar a opção No local , os dados de origem não serão excluídos ou alterados, a coluna no conjunto de dados original ainda estará disponível no designer. Para exibir os dados originais, você pode conectar o componente Adicionar colunas e associá-lo à saída de Aplicar operação matemática.

Operações matemáticas básicas

As funções na categoria Basic geralmente tomam um único valor de uma coluna, executam a operação predefinida e retornam um único valor. Para algumas funções, você pode especificar uma constante ou um conjunto de colunas como um segundo argumento.

O Azure Machine Learning suporta as seguintes funções na categoria Básico :

Abs

Devolve o valor absoluto das colunas selecionadas.

Atan2

Devolve uma tangente inversa de quatro quadrantes.

Selecione as colunas que contêm as coordenadas do ponto. Para o segundo argumento, que corresponde à coordenada x, você também pode especificar uma constante.

Corresponde à função ATAN2 no MATLAB.

Conj

Retorna o conjugado para os valores na coluna selecionada.

CubeRoot

Calcula a raiz do cubo para os valores na coluna selecionada.

DuploFatorial

Calcula o fatorial duplo para valores na coluna selecionada. O duplo fatorial é uma extensão da função fatorial normal, e é denotado como x!!.

Eps

Devolve o tamanho da lacuna entre o valor atual e o número de precisão dupla mais elevado seguinte. Corresponde à função EPS no MATLAB.

Exp

Retorna e elevado à potência do valor na coluna selecionada. Esta função é a mesma que a função EXP do Excel.

Exp2

Devolve o exponencial de base 2 dos argumentos, resolvendo por y = x * 2t onde t é uma coluna de valores contendo expoentes.

Em Conjunto de colunas, selecione a coluna que contém os valores expoentes t.

Para Exp2 , você pode especificar um segundo argumento x, que pode ser uma constante ou outra coluna de valores. Em Segundo tipo de argumento, indique se você fornecerá o multiplicador x como uma constante ou um valor em uma coluna.

Por exemplo, se você selecionar uma coluna com os valores {0,1,2,3,4,5} para o multiplicador e o expoente, a função retornará {0, 2, 8, 24, 64 160).

ExpMinus1

Devolve o expoente negativo para valores na coluna selecionada.

Fatorial

Devolve o fatorial para valores na coluna selecionada.

Hipotenusa

Calcula a hipotenusa para um triângulo no qual o comprimento de um lado é especificado como uma coluna de valores, e o comprimento do segundo lado é especificado como uma constante ou como duas colunas.

Ln

Devolve o logaritmo natural dos valores na coluna selecionada.

LnPlus1

Devolve o logaritmo natural mais um para os valores na coluna selecionada.

Registo

Retorna o log dos valores na coluna selecionada, dada a base especificada.

Você pode especificar a base (o segundo argumento) como uma constante ou selecionando outra coluna de valores.

Log10

Devolve os valores de base de 10 logaritmos para a coluna selecionada.

Log2

Devolve os valores de base de 2 logaritmos para a coluna selecionada.

NthRoot

Retorna a enésima raiz do valor, usando um n que você especificar.

Selecione as colunas para as quais você deseja calcular a raiz, usando a opção ColumnSet .

Em Segundo tipo de argumento, selecione outra coluna que contenha a raiz ou especifique uma constante a ser usada como raiz.

Se o segundo argumento for uma coluna, cada valor na coluna será usado como o valor de n para a linha correspondente. Se o segundo argumento for uma constante, digite o valor de n na caixa de texto Segundo argumento.

Pow

Calcula X elevado à potência de Y para cada um dos valores na coluna selecionada.

Primeiro, selecione as colunas que contêm a base, que deve ser um float, usando a opção ColumnSet .

Em Segundo tipo de argumento, selecione a coluna que contém o expoente ou especifique uma constante a ser usada como expoente.

Se o segundo argumento for uma coluna, cada valor na coluna será usado como expoente para a linha correspondente. Se o segundo argumento for uma constante, digite o valor do expoente na caixa de texto Segundo argumento.

Sqrt

Retorna a raiz quadrada dos valores na coluna selecionada.

SqrtPi

Para cada valor na coluna selecionada, multiplica o valor por pi e, em seguida, retorna a raiz quadrada do resultado.

Square

Quadra os valores na coluna selecionada.

Operações de comparação

Use as funções de comparação no designer do Azure Machine Learning sempre que precisar testar dois conjuntos de valores um contra o outro. Por exemplo, em um pipeline, talvez seja necessário fazer estas operações de comparação:

  • Avalie um modelo de coluna de pontuações de probabilidade em relação a um valor limite.
  • Determine se dois conjuntos de resultados são iguais. Para cada linha diferente, adicione um sinalizador FALSE que pode ser usado para processamento ou filtragem posteriores.

EqualTo

Retorna True se os valores forem os mesmos.

GreaterThan

Retorna True se os valores no conjunto de colunas forem maiores que a constante especificada ou maiores que os valores correspondentes na coluna de comparação.

MaiorThanOrEqualTo

Retorna True se os valores no conjunto de colunas forem maiores ou iguais à constante especificada, ou maiores ou iguais aos valores correspondentes na coluna de comparação.

LessThan

Retorna True se os valores no conjunto de colunas forem menores que a constante especificada ou menores que os valores correspondentes na coluna de comparação.

LessThanOrEqualTo

Retorna True se os valores no conjunto de colunas forem menores ou iguais à constante especificada, ou menores ou iguais aos valores correspondentes na coluna de comparação.

NotEqualTo

Retorna True se os valores no conjunto Column não forem iguais à constante ou coluna de comparação e retorna False se forem iguais.

Par Max

Retorna o valor maior — o valor no conjunto de colunas ou o valor na constante ou na coluna de comparação.

PairMin

Devolve o valor que é menor — o valor no conjunto de colunas ou o valor na constante ou coluna de comparação

Operações aritméticas

Inclui as operações aritméticas básicas: adição e subtração, divisão e multiplicação. Como a maioria das operações é binária, exigindo dois números, você primeiro escolhe a operação e, em seguida, escolhe a coluna ou números a serem usados no primeiro e no segundo argumentos.

A ordem de divisão e subtração é a seguinte:

  • Subtrair(Arg1_Arg2) = Arg1 - Arg 2
  • Divisão(Arg1_Arg2) = Arg1 / Arg 2

A tabela a seguir mostra alguns exemplos

Operação Núm1 Núm2 Coluna de resultados Valor do resultado
Adição 1 5 Adicionar(Num2_Num1) 6
Multiplicação 1 5 Múltiplo(Num2_Num1) 5
Subtração 5 1 Subtrair(Num2_Num1) 4
Subtração 0 1 Subtrair(Num2_Num1) -1
Divisão 5 1 Dividir(Num2_Num1) 5
Divisão 1 0 Dividir(Num2_Num1) Infinity

Adicionar

Especifique as colunas de origem usando Conjunto de colunas e, em seguida, adicione a esses valores um número especificado em Segundo argumento.

Para adicionar os valores em duas colunas, escolha uma coluna ou colunas usando Conjunto de colunas e, em seguida, escolha uma segunda coluna usando Segundo argumento.

Dividir

Divide os valores em Coluna definidos por uma constante ou pelos valores de coluna definidos no segundo argumento. Em outras palavras, você escolhe primeiro o divisor e, em seguida, o dividendo. O valor de saída é o quociente.

Multiplicar

Multiplica os valores em Coluna definidos pelos valores de constante ou coluna especificados.

Subtract

Especifique a coluna de valores em que operar (o minuend), escolhendo uma coluna diferente, usando a opção Conjunto de colunas. Em seguida, especifique o número a ser subtraído (o subtrahend) usando a lista suspensa Segundo argumento. Você pode escolher uma constante ou uma coluna de valores.

Operações de arredondamento

O designer do Azure Machine Learning dá suporte a uma variedade de operações de arredondamento. Para muitas operações, você deve especificar a quantidade de precisão a ser usada ao arredondar. Você pode usar um nível de precisão estático, especificado como uma constante, ou pode aplicar um valor de precisão dinâmica obtido de uma coluna de valores.

  • Se você usar uma constante, defina Tipo de precisão como Constante e, em seguida, digite o número de dígitos como um inteiro na caixa de texto Precisão constante . Se você digitar um número não inteiro, o componente não gerará um erro, mas os resultados podem ser inesperados.

  • Para usar um valor de precisão diferente para cada linha do conjunto de dados, defina Tipo de Precisão como ColumnSet e escolha a coluna que contém os valores de precisão apropriados.

Ceiling

Devolve o limite máximo para os valores em Conjunto de colunas.

Potência Teto2

Retorna o teto quadrado para os valores no conjunto de colunas.

Piso

Retorna o piso para os valores no conjunto de colunas, com a precisão especificada.

Mod

Retorna a parte fracionária dos valores no conjunto de colunas, com a precisão especificada.

Quociente

Retorna a parte fracionária dos valores no conjunto de colunas, com a precisão especificada.

Resto

Retorna o restante para os valores no conjunto de colunas.

Dígitos redondos

Devolve os valores no conjunto de colunas, arredondados pela regra 4/5 para o número especificado de dígitos.

RoundDown

Devolve os valores no conjunto de colunas, arredondados para baixo para o número especificado de dígitos.

RoundUp

Devolve os valores em Conjunto de colunas, arredondados para o número especificado de dígitos.

Toeven

Devolve os valores em Conjunto de colunas, arredondados para o número par inteiro mais próximo.

ToOdd

Devolve os valores em Conjunto de colunas, arredondados para o número ímpar inteiro mais próximo.

Truncar

Trunca os valores no conjunto de colunas removendo todos os dígitos não permitidos pela precisão especificada.

Funções matemáticas especiais

Esta categoria inclui funções matemáticas especializadas frequentemente usadas em ciência de dados. Salvo indicação em contrário, a função é unária e retorna o cálculo especificado para cada valor na coluna ou colunas selecionadas.

Beta

Devolve o valor da função beta de Euler.

ElípticaIntegralE

Devolve o valor da integral elíptica incompleta.

ElípticaIntegralK

Devolve o valor da integral elíptica completa (K).

Erf

Retorna o valor da função de erro.

A função de erro (também chamada de função de erro de Gauss) é uma função especial da forma sigmoide que é usada em probabilidade para descrever a difusão.

Erfc

Devolve o valor da função de erro complementar.

Erfc é definido como 1 – ERF(x).

ErfScaled

Retorna o valor da função de erro dimensionada.

A versão em escala da função de erro pode ser usada para evitar subfluxo aritmético.

ErfInverse

Devolve o valor da função inversa erf .

ExponencialIntegralEin

Devolve o valor da integral exponencial Ei.

Gama

Devolve o valor da função gama.

GammaLn

Devolve o logaritmo natural da função gama.

GamaRegularizadoP

Devolve o valor da função gama incompleta regularizada.

Esta função usa um segundo argumento, que pode ser fornecido como uma constante ou uma coluna de valores.

GammaRegularizedPInverse

Devolve o valor da função gama incompleta regularizada inversamente.

Esta função usa um segundo argumento, que pode ser fornecido como uma constante ou uma coluna de valores.

GammaRegularizedQ

Devolve o valor da função gama incompleta regularizada.

Esta função usa um segundo argumento, que pode ser fornecido como uma constante ou uma coluna de valores.

GammaRegularizedQInverse

Devolve o valor da função gama incompleta regularizada generalizada inversa.

Esta função usa um segundo argumento, que pode ser fornecido como uma constante ou uma coluna de valores.

Poligama

Devolve o valor da função polygamma.

Esta função usa um segundo argumento, que pode ser fornecido como uma constante ou uma coluna de valores.

Funções trigonométricas

Esta categoria iInclui a maioria das importantes funções trigonométricas e trigonométricas inversas. Todas as funções trigonométricas são unárias e não requerem argumentos adicionais.

Acos

Calcula o arco cosseno para os valores da coluna.

AcosDegree

Calcula o arco cosseno dos valores da coluna, em graus.

Acosh

Calcula o arco hiperbólico dos valores da coluna.

Acot

Calcula o arco cotangente dos valores da coluna.

AcotGraus

Calcula a arccotangente dos valores da coluna, em graus.

Acoth

Calcula o arco cotangente hiperbólico dos valores da coluna.

ACSC

Calcula o arcossecante dos valores da coluna.

AcscDegrees

Calcula o arcossecante dos valores da coluna, em graus.

Asec

Calcula o arco secante dos valores da coluna.

AsecDegrees

Calcula o arco secante dos valores da coluna, em graus.

Asech

Calcula o arcosecante hiperbólico dos valores da coluna.

Asin

Calcula o arco seno dos valores da coluna.

AsinGraus

Calcula o arco seno dos valores da coluna, em graus.

Asinh

Calcula o arco hiperbólico para os valores da coluna.

Atan

Calcula o arco tangente dos valores da coluna.

AtanDegrees

Calcula o arco tangente dos valores da coluna, em graus.

Atanh

Calcula o arco tangente hiperbólico dos valores da coluna.

Cos

Calcula o cosseno dos valores da coluna.

CosDegrees

Calcula o cosseno para os valores da coluna, em graus.

Cosh

Calcula o cosseno hiperbólico para os valores da coluna.

Cot

Calcula a cotangente para os valores da coluna.

CotDegrees

Calcula a cotangente para os valores da coluna, em graus.

Coth

Calcula a cotangente hiperbólica para os valores da coluna.

CSC

Calcula a cossecante para os valores da coluna.

CscDegrees

Calcula a cossecante para os valores da coluna, em graus.

Csch

Calcula a cossecante hiperbólica para os valores da coluna.

GrausToRadians

Converte graus em radianos.

Sec.

Calcula a secante dos valores da coluna.

aSecGraus

Calcula a secante para os valores da coluna, em graus.

aSech

Calcula a secante hiperbólica dos valores da coluna.

Assinar

Devolve o sinal dos valores da coluna.

Sin

Calcula o seno dos valores da coluna.

Sinc

Calcula o valor seno-cosseno dos valores da coluna.

SinDegrees

Calcula o seno para os valores da coluna, em graus.

Sinh

Calcula o seno hiperbólico dos valores da coluna.

Tan

Calcula a tangente dos valores da coluna.

TanDegrees

Calcula a tangente para o argumento, em graus.

Tanh

Calcula a tangente hiperbólica dos valores da coluna.

Notas técnicas

Tenha cuidado ao selecionar mais de uma coluna como segundo operador. Os resultados são fáceis de entender se a operação for simples, como adicionar uma constante a todas as colunas.

Suponha que seu conjunto de dados tenha várias colunas e você adicione o conjunto de dados a si mesmo. Nos resultados, cada coluna é adicionada a si mesma, da seguinte forma:

Núm1 Núm2 Núm3 Adicionar(Num1_Num1) Adicionar(Num2_Num2) Adicionar(Num3_Num3)
1 5 2 2 10 4
2 3 -1 4 6 -2
0 1 -1 0 2 -2

Se você precisar executar cálculos mais complexos, poderá encadear várias instâncias de Apply Math Operation. Por exemplo, você pode adicionar duas colunas usando uma instância de Apply Math Operation e, em seguida, usar outra instância de Apply Math Operation para dividir a soma por uma constante para obter a média.

Como alternativa, use um dos seguintes componentes para fazer todos os cálculos de uma só vez, usando script SQL, R ou Python:

Próximos passos

Consulte o conjunto de componentes disponíveis para o Azure Machine Learning.