Freigeben über


corr-Aggregatfunktion

Gilt für: durch Häkchen mit „Ja“ markiert Databricks SQL durch Häkchen mit „Ja“ markiert Databricks Runtime

Gibt den Pearson-Korrelationskoeffizienten zwischen einer Gruppe von Zahlenpaaren zurück.

Syntax

corr ( [ALL | DISTINCT] expr1, expr2 ) [FILTER ( WHERE cond ) ]

Diese Funktion kann auch mithilfe der OVER-Klausel als Fensterfunktion aufgerufen werden.

Argumente

  • expr1: Ein Ausdruck, der in einen numerischen Wert ausgewertet wird.
  • expr2: Ein Ausdruck, der in einen numerischen Wert ausgewertet wird.
  • cond: Ein optionaler boolescher Ausdruck, der die für die Aggregation verwendeten Zeilen filtert.

Gibt zurück

Einen DOUBLE-Wert.

Wenn DISTINCT angegeben wird, wird die Funktion nur für einen eindeutigen Satz von expr1-, expr2-Paaren ausgeführt.

Beispiele

> SELECT corr(c1, c2) FROM VALUES (3, 2), (3, 3), (3, 3), (6, 4) as tab(c1, c2);
 0.816496580927726

> SELECT corr(DISTINCT c1, c2) FROM VALUES (3, 2), (3, 3), (3, 3), (6, 4) as tab(c1, c2);
 0.8660254037844387

> SELECT corr(DISTINCT c1, c2) FILTER(WHERE c1 != c2)
    FROM VALUES (3, 2), (3, 3), (3, 3), (6, 4) as tab(c1, c2);
 1.0