hll_sketch_estimate
Función
Se aplica a: Databricks SQL Databricks Runtime 13.3 LTS y versiones posteriores
Esta función utiliza el algoritmo HyperLogLog para contar una aproximación probabilística del número de valores únicos en una columna determinada, consumiendo una representación binaria conocida como búfer de boceto generada previamente por la función hll_sketch_agg y devolviendo el resultado como un número entero grande.
Las funciones hll_union y hll_union_agg también pueden combinar bocetos mediante el consumo y combinación de estos búferes como entradas.
La implementación usa la Biblioteca Apache Datasketches. Para obtener más información, consulte HLL.
Sintaxis
hll_sketch_estimate ( expr )
Argumentos
expr
: Una expresiónBINARY
que contiene un boceto generado por hll_sketch_agg.
Devoluciones
Un valor BIGINT
que es el recuento distinto aproximado representado por el croquis de entrada.
Ejemplos
> SELECT hll_sketch_estimate(hll_sketch_agg(col, 12))
FROM VALUES (1), (1), (2), (2), (3) tab(col);
3
> SELECT hll_sketch_estimate(hll_sketch_agg(col))
FROM VALUES (1), (1), (2), (2), (3) tab(col);
3