Funktionen hll_sketch_estimate
Gäller för: Databricks SQL Databricks Runtime 13.3 LTS och senare
Den här funktionen använder algoritmen HyperLogLog för att räkna en probabilistisk uppskattning av antalet unika värden i en viss kolumn, vilket förbrukar en binär representation som kallas en skissbuffert som tidigare genererades av funktionen hll_sketch_agg och returnerar resultatet som ett stort heltal.
Funktionerna hll_union och hll_union_agg kan också kombinera skisser genom att använda och sammanfoga dessa buffertar som indata.
Implementeringen använder Apache Datasketches-biblioteket. Mer information finns i HLL .
Syntax
hll_sketch_estimate ( expr )
Argument
-
expr
: EttBINARY
uttryck som innehåller en skiss som genererats av hll_sketch_agg.
Returer
Ett BIGINT
värde som är det ungefärliga distinkta antalet som representeras av indataskissen.
Exempel
> SELECT hll_sketch_estimate(hll_sketch_agg(col, 12))
FROM VALUES (1), (1), (2), (2), (3) tab(col);
3
> SELECT hll_sketch_estimate(hll_sketch_agg(col))
FROM VALUES (1), (1), (2), (2), (3) tab(col);
3