corr
funkcja agregacji
Dotyczy: Databricks SQL
Databricks Runtime
Zwraca współczynnik Pearson korelacji między grupą par liczbowych.
Składnia
corr ( [ALL | DISTINCT] expr1, expr2 ) [FILTER ( WHERE cond ) ]
Tę funkcję można również wywołać jako funkcję okna przy użyciu klauzuli OVER
.
Argumenty
-
expr1
: wyrażenie, które daje w wyniku wartość liczbową. -
expr2
: wyrażenie, które daje w wyniku wartość liczbową. -
cond
: opcjonalne wyrażenie logiczne filtrujące wiersze używane do agregacji.
Zwraca
PODWÓJNA.
Jeśli DISTINCT
jest określona, funkcja działa tylko na unikalnym zestawie par expr1
, expr2
.
Przykłady
> SELECT corr(c1, c2) FROM VALUES (3, 2), (3, 3), (3, 3), (6, 4) as tab(c1, c2);
0.816496580927726
> SELECT corr(DISTINCT c1, c2) FROM VALUES (3, 2), (3, 3), (3, 3), (6, 4) as tab(c1, c2);
0.8660254037844387
> SELECT corr(DISTINCT c1, c2) FILTER(WHERE c1 != c2)
FROM VALUES (3, 2), (3, 3), (3, 3), (6, 4) as tab(c1, c2);
1.0