Função hll_sketch_estimate
Aplica-se a: SQL do Databricks Databricks Runtime 13.3 LTS e versões posteriores
Essa função utiliza o algoritmo HyperLogLog para contar uma aproximação probabilística do número de valores únicos em uma determinada coluna, consumindo uma representação binária conhecida como buffer de esboço gerado anteriormente pela função hll_sketch_agg e retornando o resultado como um grande inteiro.
As funções hll_union e hll_union_agg também podem combinar esboços consumindo e mesclando esses buffers como entradas.
A implementação usa a biblioteca Apache Datasketches. Confira HLL para obter mais informações.
Sintaxe
hll_sketch_estimate ( expr )
Argumentos
expr
: uma expressãoBINARY
segurando um esboço gerado por hll_sketch_agg.
Retornos
Um valor BIGINT
que é a contagem distinta aproximada representada pelo esboço de entrada.
Exemplos
> SELECT hll_sketch_estimate(hll_sketch_agg(col, 12))
FROM VALUES (1), (1), (2), (2), (3) tab(col);
3
> SELECT hll_sketch_estimate(hll_sketch_agg(col))
FROM VALUES (1), (1), (2), (2), (3) tab(col);
3