corr
집계 함수
적용 대상: Databricks SQL Databricks Runtime
숫자 쌍 그룹 간의 피어슨 상관 관계 계수를 반환합니다.
구문
corr ( [ALL | DISTINCT] expr1, expr2 ) [FILTER ( WHERE cond ) ]
이 함수는 OVER
절을 사용하여 창 함수로 호출할 수도 있습니다.
인수
expr1
: 숫자로 계산되는 식입니다.expr2
: 숫자로 계산되는 식입니다.cond
: 집계에 사용되는 행을 필터링하는 선택적 부울 식입니다.
반품
DOUBLE입니다.
DISTINCT
가 지정된 경우 함수는 고유한 expr1
, expr2
쌍 집합에서만 작동합니다.
예제
> SELECT corr(c1, c2) FROM VALUES (3, 2), (3, 3), (3, 3), (6, 4) as tab(c1, c2);
0.816496580927726
> SELECT corr(DISTINCT c1, c2) FROM VALUES (3, 2), (3, 3), (3, 3), (6, 4) as tab(c1, c2);
0.8660254037844387
> SELECT corr(DISTINCT c1, c2) FILTER(WHERE c1 != c2)
FROM VALUES (3, 2), (3, 3), (3, 3), (6, 4) as tab(c1, c2);
1.0