corr
(función de agregado)
Se aplica a: Databricks SQL Databricks Runtime
Devuelve el coeficiente de correlación de Pearson entre un grupo de pares de números.
Sintaxis
corr ( [ALL | DISTINCT] expr1, expr2 ) [FILTER ( WHERE cond ) ]
Esta función también se puede invocar como una función de ventana mediante la cláusula OVER
.
Argumentos
expr1
: una expresión que se evalúa como un número.expr2
: una expresión que se evalúa como un número.cond
: una expresión booleana opcional que filtra las filas usadas para la agregación.
Devoluciones
Un valor DOUBLE.
Si se especifica DISTINCT
, la función solo afecta a un conjunto único de pares expr1
, expr2
.
Ejemplos
> SELECT corr(c1, c2) FROM VALUES (3, 2), (3, 3), (3, 3), (6, 4) as tab(c1, c2);
0.816496580927726
> SELECT corr(DISTINCT c1, c2) FROM VALUES (3, 2), (3, 3), (3, 3), (6, 4) as tab(c1, c2);
0.8660254037844387
> SELECT corr(DISTINCT c1, c2) FILTER(WHERE c1 != c2)
FROM VALUES (3, 2), (3, 3), (3, 3), (6, 4) as tab(c1, c2);
1.0