corr
statistische functie
Van toepassing op: Databricks SQL Databricks Runtime
Berekent de Pearson-correlatiecoƫfficiƫnt tussen een groep getalparen.
Syntaxis
corr ( [ALL | DISTINCT] expr1, expr2 ) [FILTER ( WHERE cond ) ]
Deze functie kan ook worden aangeroepen als een window-functie met behulp van de OVER
clausule.
Argumenten
-
expr1
: Een expressie die resulteert in een numerieke waarde. -
expr2
: Een expressie die resulteert in een numerieke waarde. -
cond
: Een optionele Boole-expressie die de rijen filtert die worden gebruikt voor aggregatie.
Retouren
EEN DUBBELE.
Als DISTINCT
is opgegeven, werkt de functie alleen op een uniek paar van set en expr2
van expr1
.
Voorbeelden
> SELECT corr(c1, c2) FROM VALUES (3, 2), (3, 3), (3, 3), (6, 4) as tab(c1, c2);
0.816496580927726
> SELECT corr(DISTINCT c1, c2) FROM VALUES (3, 2), (3, 3), (3, 3), (6, 4) as tab(c1, c2);
0.8660254037844387
> SELECT corr(DISTINCT c1, c2) FILTER(WHERE c1 != c2)
FROM VALUES (3, 2), (3, 3), (3, 3), (6, 4) as tab(c1, c2);
1.0