Partilhar via


Função hll_sketch_estimate

Aplica-se a: Marque Sim Databricks SQL Marque Sim Databricks Runtime 13.3 LTS e superior

Esta função utiliza o algoritmo HyperLogLog para contar uma aproximação probabilística do número de valores exclusivos em uma determinada coluna, consumindo uma representação binária conhecida como buffer de esboço previamente gerada pela função hll_sketch_agg e retornando o resultado como um grande inteiro.

As funções hll_union e hll_union_agg também podem combinar esboços consumindo e mesclando esses buffers como entradas.

A implementação usa a biblioteca Apache Datasketches. Consulte HLL para obter mais informações.

Sintaxe

hll_sketch_estimate ( expr )

Argumentos

  • expr: Uma BINARY expressão que contém um esboço gerado por hll_sketch_agg.

Devoluções

Um BIGINT valor que é a contagem distinta aproximada representada pelo esboço de entrada.

Exemplos

> SELECT hll_sketch_estimate(hll_sketch_agg(col, 12))
    FROM VALUES (1), (1), (2), (2), (3) tab(col);
  3

> SELECT hll_sketch_estimate(hll_sketch_agg(col))
    FROM VALUES (1), (1), (2), (2), (3) tab(col);
  3