Fonction hll_sketch_estimate
S’applique à : Databricks SQL Databricks Runtime 13.3 LTS et versions ultérieures
Cette fonction utilise l’algorithme HyperLogLog pour compter une approximation probabiliste du nombre de valeurs uniques d’une colonne donnée, en consommant une représentation binaire appelée mémoire tampon de croquis précédemment générée par la fonction hll_sketch_agg et en retournant le résultat sous forme d’entier très grand.
Les fonctions hll_union et hll_union_agg peuvent également combiner des croquis en consommant et en fusionnant ces mémoires tampons en tant qu’entrées.
L’implémentation utilise la bibliothèque Apache Datasketches. Veuillez consulter HLL pour plus d'informations.
Syntaxe
hll_sketch_estimate ( expr )
Arguments
expr
: une expressionBINARY
contenant un croquis généré par hll_sketch_agg.
Retours
Valeur BIGINT
qui est le nombre distinct approximatif représenté par le croquis d’entrée.
Exemples
> SELECT hll_sketch_estimate(hll_sketch_agg(col, 12))
FROM VALUES (1), (1), (2), (2), (3) tab(col);
3
> SELECT hll_sketch_estimate(hll_sketch_agg(col))
FROM VALUES (1), (1), (2), (2), (3) tab(col);
3