Compartilhar via


Função de agregação bitmap_or_agg

Aplica-se a:verificação marcada como sim SQL do Databricks marca de seleção positiva Databricks Runtime 13.3 LTS e versões posteriores

Retorna o bit a bit OR de todos os BINARY valores de entrada no grupo.

A função é comumente usada para contar o número de números integrais distintos em combinação com as funções bitmap_bucket_number(), bitmap_count(), bitmap_bit_position() e bitmap_construct_agg().

Para agregar bitmaps em forma de numéricos integrais, use a função de agregação bit_or(). Para agregar posições de bit em um bitmap BINARY, use a função de agregação bitmap_construct_agg().

Sintaxe

bitmap_or_agg(expr) [FILTER ( WHERE cond ) ]

Essa função também pode ser invocada como uma função de janela usando a cláusula OVER.

Argumentos

  • expr: um BINARY de comprimento <= 4096 que representa um bitmap. O Azure Databricks trunca valores mais longos para 4096.
  • cond: uma expressão booliana opcional que filtra as linhas usadas para agregação.

Retornos

Um BINARY de comprimento 4096.

Exemplos

> SELECT hex(trim(TRAILING X'00' FROM bitmap_or_agg(val))) FROM VALUES(x'10'), (x'02') AS T(val);
 12

-- Count the number of distinct values across two tables
> SELECT sum(num_distinct) AS num_distinct
    FROM (SELECT bucket, bitmap_count(bitmap_or_agg(num_distinct)) AS num_distinct
            FROM ((SELECT bitmap_bucket_number(val) AS bucket,
                          bitmap_construct_agg(bitmap_bit_position(val)) AS num_distinct
                     FROM VALUES(1), (2), (1), (-1), (5), (0), (5) AS t(val)
                     GROUP BY ALL)
                  UNION ALL
                  (SELECT bitmap_bucket_number(val) AS bucket,
                          bitmap_construct_agg(bitmap_bit_position(val)) AS num_distinct
                     FROM VALUES(3), (1), (-1), (6), (5), (1), (5), (8) AS t(val)
                     GROUP BY ALL))
            GROUP BY ALL);
  8