hll_sketch_estimate
-functie
Van toepassing op: Databricks SQL Databricks Runtime 13.3 LTS en hoger
Deze functie maakt gebruik van het HyperLogLog-algoritme om een probabilistische benadering van het aantal unieke waarden in een bepaalde kolom te tellen, waarbij een binaire weergave wordt gebruikt die eerder is gegenereerd door de hll_sketch_agg-functie en het resultaat als een groot geheel getal retourneert.
De functies hll_union en hll_union_agg kunnen ook schetsen combineren door deze buffers als invoer te gebruiken en samen te voegen.
De implementatie maakt gebruik van de Apache Datasketches-bibliotheek. Zie HLL voor meer informatie.
Syntaxis
hll_sketch_estimate ( expr )
Argumenten
expr
: EenBINARY
expressie met een schets die wordt gegenereerd door hll_sketch_agg.
Retouren
Een BIGINT
waarde die het geschatte aantal afzonderlijke waarden is dat wordt vertegenwoordigd door de invoerschets.
Voorbeelden
> SELECT hll_sketch_estimate(hll_sketch_agg(col, 12))
FROM VALUES (1), (1), (2), (2), (3) tab(col);
3
> SELECT hll_sketch_estimate(hll_sketch_agg(col))
FROM VALUES (1), (1), (2), (2), (3) tab(col);
3