Агрегатная функция bitmap_or_agg
Область применения: Databricks SQL
Databricks Runtime 13.3 LTS и выше
Возвращает битовое OR
значение всех BINARY
входных значений в группе.
Функция обычно используется для подсчета количества отдельных целых чисел в сочетании с функциями bitmap_bucket_number(), bitmap_count(), bitmap_bit_position()и bitmap_construct_agg().
Чтобы агрегировать растровые изображения в виде целочисленных числовых значений, используйте агрегатную функцию bit_or( ).
Чтобы агрегировать битовые позиции в растровом рисунке BINARY
, используйте bitmap_construct_agg().
Синтаксис
bitmap_or_agg(expr) [FILTER ( WHERE cond ) ]
Эту функцию также можно вызвать как функцию окна с помощью OVER
предложения.
Аргументы
-
expr
BINARY
: длина<= 4096
, представляющая растровое изображение. Azure Databricks усечено до 4096. -
cond
: необязательное логическое выражение для фильтрации строк, используемых для агрегирования.
Возвраты
Длина BINARY
4096.
Примеры
> SELECT hex(trim(TRAILING X'00' FROM bitmap_or_agg(val))) FROM VALUES(x'10'), (x'02') AS T(val);
12
-- Count the number of distinct values across two tables
> SELECT sum(num_distinct) AS num_distinct
FROM (SELECT bucket, bitmap_count(bitmap_or_agg(num_distinct)) AS num_distinct
FROM ((SELECT bitmap_bucket_number(val) AS bucket,
bitmap_construct_agg(bitmap_bit_position(val)) AS num_distinct
FROM VALUES(1), (2), (1), (-1), (5), (0), (5) AS t(val)
GROUP BY ALL)
UNION ALL
(SELECT bitmap_bucket_number(val) AS bucket,
bitmap_construct_agg(bitmap_bit_position(val)) AS num_distinct
FROM VALUES(3), (1), (-1), (6), (5), (1), (5), (8) AS t(val)
GROUP BY ALL))
GROUP BY ALL);
8