Função hll_sketch_estimate
Aplica-se a: Databricks SQL Databricks Runtime 13.3 LTS e superior
Esta função utiliza o algoritmo HyperLogLog para contar uma aproximação probabilística do número de valores exclusivos em uma determinada coluna, consumindo uma representação binária conhecida como buffer de esboço previamente gerada pela função hll_sketch_agg e retornando o resultado como um grande inteiro.
As funções hll_union e hll_union_agg também podem combinar esboços consumindo e mesclando esses buffers como entradas.
A implementação usa a biblioteca Apache Datasketches. Consulte HLL para obter mais informações.
Sintaxe
hll_sketch_estimate ( expr )
Argumentos
expr
: UmaBINARY
expressão que contém um esboço gerado por hll_sketch_agg.
Devoluções
Um BIGINT
valor que é a contagem distinta aproximada representada pelo esboço de entrada.
Exemplos
> SELECT hll_sketch_estimate(hll_sketch_agg(col, 12))
FROM VALUES (1), (1), (2), (2), (3) tab(col);
3
> SELECT hll_sketch_estimate(hll_sketch_agg(col))
FROM VALUES (1), (1), (2), (2), (3) tab(col);
3