corr
mängdfunktion
Gäller för: Databricks SQL Databricks Runtime
Returnerar Pearson-korrelationskoefficienten mellan en grupp med talpar.
Syntax
corr ( [ALL | DISTINCT] expr1, expr2 ) [FILTER ( WHERE cond ) ]
Den här funktionen kan också anropas som en window funktion med hjälp av OVER
-satsen.
Argument
-
expr1
: Ett uttryck som utvärderas till ett numeriskt uttryck. -
expr2
: Ett uttryck som utvärderas till ett numeriskt uttryck. -
cond
: Ett valfritt booleskt uttryck som filtrerar de rader som används för aggregering.
Returer
EN DUBBEL.
Om DISTINCT
anges fungerar funktionen endast på ett unikt set av expr1
-, expr2
-par.
Exempel
> SELECT corr(c1, c2) FROM VALUES (3, 2), (3, 3), (3, 3), (6, 4) as tab(c1, c2);
0.816496580927726
> SELECT corr(DISTINCT c1, c2) FROM VALUES (3, 2), (3, 3), (3, 3), (6, 4) as tab(c1, c2);
0.8660254037844387
> SELECT corr(DISTINCT c1, c2) FILTER(WHERE c1 != c2)
FROM VALUES (3, 2), (3, 3), (3, 3), (6, 4) as tab(c1, c2);
1.0