corr
função agregar
Aplica-se a: Databricks SQL Databricks Runtime
Devolve o coeficiente de correlação de Pearson entre um grupo de pares numéricos.
Sintaxe
corr ( [ALL | DISTINCT] expr1, expr2 ) [FILTER ( WHERE cond ) ]
Esta função também pode ser invocada como uma função de janela usando a OVER
cláusula.
Argumentos
expr1
: Uma expressão que é avaliada como numérica.expr2
: Uma expressão que é avaliada como numérica.cond
: Uma expressão booleana opcional filtrando as linhas usadas para agregação.
Devoluções
UM DUPLO.
Se DISTINCT
for especificado, a função opera apenas em um conjunto exclusivo de expr1
pares , expr2
.
Exemplos
> SELECT corr(c1, c2) FROM VALUES (3, 2), (3, 3), (3, 3), (6, 4) as tab(c1, c2);
0.816496580927726
> SELECT corr(DISTINCT c1, c2) FROM VALUES (3, 2), (3, 3), (3, 3), (6, 4) as tab(c1, c2);
0.8660254037844387
> SELECT corr(DISTINCT c1, c2) FILTER(WHERE c1 != c2)
FROM VALUES (3, 2), (3, 3), (3, 3), (6, 4) as tab(c1, c2);
1.0