Fonction d’agrégation corr
S’applique à : Databricks SQL Databricks Runtime
Retourne un coefficient de corrélation de Pearson entre un groupe de paires de nombres.
Syntaxe
corr ( [ALL | DISTINCT] expr1, expr2 ) [FILTER ( WHERE cond ) ]
Cette fonction peut également être appelée en tant que fonction de fenêtre à l’aide de la clause OVER
.
Arguments
expr1
: Expression qui prend une valeur numérique.expr2
: Expression qui prend une valeur numérique.cond
: expression booléenne facultative qui filtre les lignes utilisées pour l’agrégation.
Retours
Une valeur DOUBLE.
Si DISTINCT
est spécifié, la fonction ne s’applique qu’à un ensemble unique de paires expr1
, expr2
.
Exemples
> SELECT corr(c1, c2) FROM VALUES (3, 2), (3, 3), (3, 3), (6, 4) as tab(c1, c2);
0.816496580927726
> SELECT corr(DISTINCT c1, c2) FROM VALUES (3, 2), (3, 3), (3, 3), (6, 4) as tab(c1, c2);
0.8660254037844387
> SELECT corr(DISTINCT c1, c2) FILTER(WHERE c1 != c2)
FROM VALUES (3, 2), (3, 3), (3, 3), (6, 4) as tab(c1, c2);
1.0