Delen via


corr statistische functie

Van toepassing op:vinkje als ja aan Databricks SQL vinkje als ja aan Databricks Runtime

Berekent de Pearson-correlatiecoƫfficiƫnt tussen een groep getalparen.

Syntaxis

corr ( [ALL | DISTINCT] expr1, expr2 ) [FILTER ( WHERE cond ) ]

Deze functie kan ook worden aangeroepen als een window-functie met behulp van de OVER clausule.

Argumenten

  • expr1: Een expressie die resulteert in een numerieke waarde.
  • expr2: Een expressie die resulteert in een numerieke waarde.
  • cond: Een optionele Boole-expressie die de rijen filtert die worden gebruikt voor aggregatie.

Retouren

EEN DUBBELE.

Als DISTINCT is opgegeven, werkt de functie alleen op een uniek paar van set en expr2 van expr1.

Voorbeelden

> SELECT corr(c1, c2) FROM VALUES (3, 2), (3, 3), (3, 3), (6, 4) as tab(c1, c2);
 0.816496580927726

> SELECT corr(DISTINCT c1, c2) FROM VALUES (3, 2), (3, 3), (3, 3), (6, 4) as tab(c1, c2);
 0.8660254037844387

> SELECT corr(DISTINCT c1, c2) FILTER(WHERE c1 != c2)
    FROM VALUES (3, 2), (3, 3), (3, 3), (6, 4) as tab(c1, c2);
 1.0