corr
-Aggregatfunktion
Gilt für: Databricks SQL Databricks Runtime
Gibt den Pearson-Korrelationskoeffizienten zwischen einer Gruppe von Zahlenpaaren zurück.
Syntax
corr ( [ALL | DISTINCT] expr1, expr2 ) [FILTER ( WHERE cond ) ]
Diese Funktion kann auch mithilfe der OVER
-Klausel als Fensterfunktion aufgerufen werden.
Argumente
expr1
: Ein Ausdruck, der in einen numerischen Wert ausgewertet wird.expr2
: Ein Ausdruck, der in einen numerischen Wert ausgewertet wird.cond
: Ein optionaler boolescher Ausdruck, der die für die Aggregation verwendeten Zeilen filtert.
Gibt zurück
Einen DOUBLE-Wert.
Wenn DISTINCT
angegeben wird, wird die Funktion nur für einen eindeutigen Satz von expr1
-, expr2
-Paaren ausgeführt.
Beispiele
> SELECT corr(c1, c2) FROM VALUES (3, 2), (3, 3), (3, 3), (6, 4) as tab(c1, c2);
0.816496580927726
> SELECT corr(DISTINCT c1, c2) FROM VALUES (3, 2), (3, 3), (3, 3), (6, 4) as tab(c1, c2);
0.8660254037844387
> SELECT corr(DISTINCT c1, c2) FILTER(WHERE c1 != c2)
FROM VALUES (3, 2), (3, 3), (3, 3), (6, 4) as tab(c1, c2);
1.0