Compartilhar via


Função hll_sketch_estimate

Aplica-se a: verificação marcada como sim SQL do Databricks verificação marcada como sim Databricks Runtime 13.3 LTS e versões posteriores

Essa função utiliza o algoritmo HyperLogLog para contar uma aproximação probabilística do número de valores únicos em uma determinada coluna, consumindo uma representação binária conhecida como buffer de esboço gerado anteriormente pela função hll_sketch_agg e retornando o resultado como um grande inteiro.

As funções hll_union e hll_union_agg também podem combinar esboços consumindo e mesclando esses buffers como entradas.

A implementação usa a biblioteca Apache Datasketches. Confira HLL para obter mais informações.

Sintaxe

hll_sketch_estimate ( expr )

Argumentos

  • expr: uma expressão BINARY segurando um esboço gerado por hll_sketch_agg.

Retornos

Um valor BIGINT que é a contagem distinta aproximada representada pelo esboço de entrada.

Exemplos

> SELECT hll_sketch_estimate(hll_sketch_agg(col, 12))
    FROM VALUES (1), (1), (2), (2), (3) tab(col);
  3

> SELECT hll_sketch_estimate(hll_sketch_agg(col))
    FROM VALUES (1), (1), (2), (2), (3) tab(col);
  3