次の方法で共有


bitmap_or_agg 集計関数

適用対象: check marked yes Databricks SQL 「はい」のチェック マーク Databricks Runtime 13.3 LTS 以降

グループ内のすべての BINARY 入力値のビット演算 (OR) を返します。

関数は、通常、bitmap_bucket_number() 関数、bitmap_count() 関数、bitmap_bit_position() 関数、およびbitmap_construct_agg() 関数を組み合わせて、個別の整数の高密度なセットの数をカウントするために使われます。

整数数値の形式でビットマップを集計するには、bit_or() 集計関数を使います。 ビット位置を BINARY ビットマップに集計するには、bitmap_construct_agg() を使用します。

構文

bitmap_or_agg(expr) [FILTER ( WHERE cond ) ]

この関数は、OVER 句を使用して ウィンドウ 関数として呼び出すこともできます。

引数

  • expr: ビットマップを表す長さ <= 4096BINARY。 Azure Databricks では、長い値が 4096 に切り捨てられます。
  • cond: 集計に使用される行をフィルター処理するブール式 (省略可能)。

返品

長さ 4096 の BINARY

> SELECT hex(trim(TRAILING X'00' FROM bitmap_or_agg(val))) FROM VALUES(x'10'), (x'02') AS T(val);
 12

-- Count the number of distinct values across two tables
> SELECT sum(num_distinct) AS num_distinct
    FROM (SELECT bucket, bitmap_count(bitmap_or_agg(num_distinct)) AS num_distinct
            FROM ((SELECT bitmap_bucket_number(val) AS bucket,
                          bitmap_construct_agg(bitmap_bit_position(val)) AS num_distinct
                     FROM VALUES(1), (2), (1), (-1), (5), (0), (5) AS t(val)
                     GROUP BY ALL)
                  UNION ALL
                  (SELECT bitmap_bucket_number(val) AS bucket,
                          bitmap_construct_agg(bitmap_bit_position(val)) AS num_distinct
                     FROM VALUES(3), (1), (-1), (6), (5), (1), (5), (8) AS t(val)
                     GROUP BY ALL))
            GROUP BY ALL);
  8