Поделиться через


Агрегатная функция corr

Область применения:флажок Databricks SQL флажок Databricks Runtime

Возвращает коэффициент Пирсона для корреляции между группой пар чисел.

Синтаксис

corr ( [ALL | DISTINCT] expr1, expr2 ) [FILTER ( WHERE cond ) ]

Эту функцию также можно вызвать как функцию window с помощью предложения OVER.

Аргументы

  • expr1: выражение, значением которого является число.
  • expr2: выражение, значением которого является число.
  • cond: необязательное логическое выражение для фильтрации строк, используемых для агрегирования.

Возвраты

Значение DOUBLE.

Если DISTINCT указан, функция работает только на уникальной паре set, expr1expr2.

Примеры

> SELECT corr(c1, c2) FROM VALUES (3, 2), (3, 3), (3, 3), (6, 4) as tab(c1, c2);
 0.816496580927726

> SELECT corr(DISTINCT c1, c2) FROM VALUES (3, 2), (3, 3), (3, 3), (6, 4) as tab(c1, c2);
 0.8660254037844387

> SELECT corr(DISTINCT c1, c2) FILTER(WHERE c1 != c2)
    FROM VALUES (3, 2), (3, 3), (3, 3), (6, 4) as tab(c1, c2);
 1.0