corr
集計関数
適用対象: Databricks SQL Databricks Runtime
数値ペアのグループ間におけるピアソン係数の相関関係を返します。
構文
corr ( [ALL | DISTINCT] expr1, expr2 ) [FILTER ( WHERE cond ) ]
この関数は、OVER
句を使用して ウィンドウ 関数として呼び出すこともできます。
引数
expr1
: 数値に評価される式。expr2
: 数値に評価される式。cond
: 集計に使用される行をフィルター処理するブール式 (省略可能)。
戻り値
DOUBLE。
DISTINCT
が指定されている場合、関数は一意のセットである expr1
と expr2
のペアに対してのみ動作します。
例
> SELECT corr(c1, c2) FROM VALUES (3, 2), (3, 3), (3, 3), (6, 4) as tab(c1, c2);
0.816496580927726
> SELECT corr(DISTINCT c1, c2) FROM VALUES (3, 2), (3, 3), (3, 3), (6, 4) as tab(c1, c2);
0.8660254037844387
> SELECT corr(DISTINCT c1, c2) FILTER(WHERE c1 != c2)
FROM VALUES (3, 2), (3, 3), (3, 3), (6, 4) as tab(c1, c2);
1.0