Condividi tramite


bitmap_or_agg funzione di aggregazione

Si applica a: segno di spunta sì Databricks SQL segno di spunta sì Databricks Runtime 13.3 LTS e versioni successive

Restituisce il bitwise OR di tutti i valori di input BINARY del gruppo.

La funzione viene comunemente usata per contare il numero di numeri integrali distinti in combinazione con le funzioni bitmap_bucket_number(), bitmap_count(), bitmap_bit_position()e bitmap_construct_agg().

Per aggregare bitmap sotto forma di numeri integrali, usare la funzione di aggregazione bit_or(). Per aggregare le posizioni dei bit in una BINARY bitmap, usare bitmap_construct_agg().

Sintassi

bitmap_or_agg(expr) [FILTER ( WHERE cond ) ]

Questa funzione può anche essere richiamata come funzione window usando la OVER clausola .

Argomenti

  • expr: valore BINARY di lunghezza <= 4096 che rappresenta una bitmap. Azure Databricks tronca valori più lunghi a 4096.
  • cond: espressione booleana facoltativa che filtra le righe usate per l'aggregazione.

Valori restituiti

Oggetto BINARY di lunghezza 4096.

Esempi

> SELECT hex(trim(TRAILING X'00' FROM bitmap_or_agg(val))) FROM VALUES(x'10'), (x'02') AS T(val);
 12

-- Count the number of distinct values across two tables
> SELECT sum(num_distinct) AS num_distinct
    FROM (SELECT bucket, bitmap_count(bitmap_or_agg(num_distinct)) AS num_distinct
            FROM ((SELECT bitmap_bucket_number(val) AS bucket,
                          bitmap_construct_agg(bitmap_bit_position(val)) AS num_distinct
                     FROM VALUES(1), (2), (1), (-1), (5), (0), (5) AS t(val)
                     GROUP BY ALL)
                  UNION ALL
                  (SELECT bitmap_bucket_number(val) AS bucket,
                          bitmap_construct_agg(bitmap_bit_position(val)) AS num_distinct
                     FROM VALUES(3), (1), (-1), (6), (5), (1), (5), (8) AS t(val)
                     GROUP BY ALL))
            GROUP BY ALL);
  8