Агрегатная функция corr
Область применения: Databricks SQL Databricks Runtime
Возвращает коэффициент Пирсона для корреляции между группой пар чисел.
Синтаксис
corr ( [ALL | DISTINCT] expr1, expr2 ) [FILTER ( WHERE cond ) ]
Эту функцию также можно вызвать как функцию window с помощью предложения OVER
.
Аргументы
-
expr1
: выражение, значением которого является число. -
expr2
: выражение, значением которого является число. -
cond
: необязательное логическое выражение для фильтрации строк, используемых для агрегирования.
Возвраты
Значение DOUBLE.
Если DISTINCT
указан, функция работает только на уникальной паре set, expr1
expr2
.
Примеры
> SELECT corr(c1, c2) FROM VALUES (3, 2), (3, 3), (3, 3), (6, 4) as tab(c1, c2);
0.816496580927726
> SELECT corr(DISTINCT c1, c2) FROM VALUES (3, 2), (3, 3), (3, 3), (6, 4) as tab(c1, c2);
0.8660254037844387
> SELECT corr(DISTINCT c1, c2) FILTER(WHERE c1 != c2)
FROM VALUES (3, 2), (3, 3), (3, 3), (6, 4) as tab(c1, c2);
1.0
Связанные
- функции Window