bitmap_or_agg
집계 함수
적용 대상: Databricks SQL Databricks Runtime 13.3 LTS 이상
그룹의 모든 OR
입력 값에 대해 비트 연산 BINARY
을 반환합니다.
이 함수는 일반적으로 bitmap_bucket_number(), bitmap_count(), bitmap_bit_position(), bitmap_construct_agg() 함수와 함께 고유 정수 수를 계산하는 데 사용됩니다.
정수 숫자 형식의 비트맵을 집계하려면 bit_or() 집계 함수를 사용합니다.
비트 위치를 비트맵으로 BINARY
집계하려면 bitmap_construct_agg()를 사용합니다.
구문
bitmap_or_agg(expr) [FILTER ( WHERE cond ) ]
이 함수는
인수
-
expr
BINARY
: 비트맵을 나타내는 길이<= 4096
입니다. Azure Databricks는 더 긴 값을 4096으로 자립니다. -
cond
: 집계에 사용되는 행을 필터링하는 선택적 부울 식입니다.
반품
길이 4096의 A BINARY
.
예제
> SELECT hex(trim(TRAILING X'00' FROM bitmap_or_agg(val))) FROM VALUES(x'10'), (x'02') AS T(val);
12
-- Count the number of distinct values across two tables
> SELECT sum(num_distinct) AS num_distinct
FROM (SELECT bucket, bitmap_count(bitmap_or_agg(num_distinct)) AS num_distinct
FROM ((SELECT bitmap_bucket_number(val) AS bucket,
bitmap_construct_agg(bitmap_bit_position(val)) AS num_distinct
FROM VALUES(1), (2), (1), (-1), (5), (0), (5) AS t(val)
GROUP BY ALL)
UNION ALL
(SELECT bitmap_bucket_number(val) AS bucket,
bitmap_construct_agg(bitmap_bit_position(val)) AS num_distinct
FROM VALUES(3), (1), (-1), (6), (5), (1), (5), (8) AS t(val)
GROUP BY ALL))
GROUP BY ALL);
8