Partager via


Fonction hll_sketch_estimate

S’applique à : coche marquée oui Databricks SQL case marquée oui Databricks Runtime 13.3 LTS et versions ultérieures

Cette fonction utilise l’algorithme HyperLogLog pour compter une approximation probabiliste du nombre de valeurs uniques d’une colonne donnée, en consommant une représentation binaire appelée mémoire tampon de croquis précédemment générée par la fonction hll_sketch_agg et en retournant le résultat sous forme d’entier très grand.

Les fonctions hll_union et hll_union_agg peuvent également combiner des croquis en consommant et en fusionnant ces mémoires tampons en tant qu’entrées.

L’implémentation utilise la bibliothèque Apache Datasketches. Veuillez consulter HLL pour plus d'informations.

Syntaxe

hll_sketch_estimate ( expr )

Arguments

  • expr : une expression BINARY contenant un croquis généré par hll_sketch_agg.

Retours

Valeur BIGINT qui est le nombre distinct approximatif représenté par le croquis d’entrée.

Exemples

> SELECT hll_sketch_estimate(hll_sketch_agg(col, 12))
    FROM VALUES (1), (1), (2), (2), (3) tab(col);
  3

> SELECT hll_sketch_estimate(hll_sketch_agg(col))
    FROM VALUES (1), (1), (2), (2), (3) tab(col);
  3