Delen via


bitmap_construct_agg statistische functie

Van toepassing op: vinkje als ja aan Databricks SQL vinkje als ja aan Databricks Runtime 13.3 LTS en hoger

Retourneert de bitsgewijze OR waarden van alle bitposities in de groep. tussen 0 en 32767 in een groep als een BINARY.

De functie wordt vaak gebruikt om het aantal afzonderlijke integrale getallen in combinatie met de functies bitmap_bucket_number(), bitmap_count()en bitmap_bit_position() te tellen.

Als u bitmaps wilt aggregeren in de vorm van integrale numerieke gegevens, gebruikt u de statistische functie bit_or().

Syntaxis

bitmap_construct_agg(expr) [FILTER ( WHERE cond ) ]

Deze functie kan ook worden aangeroepen als een vensterfunctie met behulp van de OVER component.

Argumenten

  • expr: Een integrale numerieke expressie tussen 0 en 32767 die een bitpositie in een BINARY tekenreeks vertegenwoordigt.
  • cond: Een optionele Boole-expressie die de rijen filtert die worden gebruikt voor aggregatie.

Retouren

Een BINARY lengte van 4096.

Voorbeelden

> SELECT hex(trim(TRAILING X'00' FROM bitmap_construct_agg(val))) FROM VALUES(0) AS T(val);
 01

> SELECT hex(trim(TRAILING X'00' FROM bitmap_construct_agg(val))) FROM VALUES(15) AS T(val);
 0080

> SELECT hex(trim(TRAILING X'00' FROM bitmap_construct_agg(val)))
   FROM VALUES(1), (3), (7), (15), (31) AS T(val);
 8A800080

-- Count the number of distinct values
> SELECT sum(num_distinct) AS num_distinct
    FROM (SELECT bitmap_bucket_number(val),
                 bitmap_count(bitmap_construct_agg(bitmap_bit_position(val)))
            FROM VALUES(1), (2), (1), (-1), (5), (0), (5) AS t(val)
            GROUP BY ALL) AS distinct_vals_by_bucket(bucket, num_distinct)
  5