Delen via


hll_sketch_estimate-functie

Van toepassing op: vinkje als ja aan Databricks SQL vinkje als ja aan Databricks Runtime 13.3 LTS en hoger

Deze functie maakt gebruik van het HyperLogLog-algoritme om een probabilistische benadering van het aantal unieke waarden in een bepaalde kolom te tellen, waarbij een binaire weergave wordt gebruikt die eerder is gegenereerd door de hll_sketch_agg-functie en het resultaat als een groot geheel getal retourneert.

De functies hll_union en hll_union_agg kunnen ook schetsen combineren door deze buffers als invoer te gebruiken en samen te voegen.

De implementatie maakt gebruik van de Apache Datasketches-bibliotheek. Zie HLL voor meer informatie.

Syntaxis

hll_sketch_estimate ( expr )

Argumenten

  • expr: Een BINARY expressie met een schets die wordt gegenereerd door hll_sketch_agg.

Retouren

Een BIGINT waarde die het geschatte aantal afzonderlijke waarden is dat wordt vertegenwoordigd door de invoerschets.

Voorbeelden

> SELECT hll_sketch_estimate(hll_sketch_agg(col, 12))
    FROM VALUES (1), (1), (2), (2), (3) tab(col);
  3

> SELECT hll_sketch_estimate(hll_sketch_agg(col))
    FROM VALUES (1), (1), (2), (2), (3) tab(col);
  3