次の方法で共有


corr 集計関数

適用対象: 「はい」のチェック マーク Databricks SQL 「はい」のチェック マーク Databricks Runtime

数値ペアのグループ間におけるピアソン係数の相関関係を返します。

構文

corr ( [ALL | DISTINCT] expr1, expr2 ) [FILTER ( WHERE cond ) ]

この関数は、OVER 句を使用して ウィンドウ 関数として呼び出すこともできます。

引数

  • expr1: 数値に評価される式。
  • expr2: 数値に評価される式。
  • cond: 集計に使用される行をフィルター処理するブール式 (省略可能)。

戻り値

DOUBLE。

DISTINCT が指定されている場合、関数は一意のセットである expr1expr2 のペアに対してのみ動作します。

> SELECT corr(c1, c2) FROM VALUES (3, 2), (3, 3), (3, 3), (6, 4) as tab(c1, c2);
 0.816496580927726

> SELECT corr(DISTINCT c1, c2) FROM VALUES (3, 2), (3, 3), (3, 3), (6, 4) as tab(c1, c2);
 0.8660254037844387

> SELECT corr(DISTINCT c1, c2) FILTER(WHERE c1 != c2)
    FROM VALUES (3, 2), (3, 3), (3, 3), (6, 4) as tab(c1, c2);
 1.0