Udostępnij za pośrednictwem


Funkcja hll_sketch_estimate

Dotyczy: zaznacz pole wyboru oznaczone jako tak Databricks SQL zaznacz pole wyboru oznaczone jako tak Databricks Runtime 13.3 LTS i nowsze

Ta funkcja wykorzystuje algorytm HyperLogLog do zliczania probabilistycznego przybliżenia liczby unikatowych wartości w danej kolumnie, wykorzystując reprezentację binarną znaną jako bufor szkicu wygenerowany wcześniej przez funkcję hll_sketch_agg i zwracając wynik jako dużą liczbę całkowitą.

Funkcje hll_union i hll_union_agg mogą również łączyć szkice, zużywając i scalając te jako dane wejściowe.

Implementacja używa biblioteki Apache Datasketches. Aby uzyskać więcej informacji, zobacz HLL .

Składnia

hll_sketch_estimate ( expr )

Argumenty

  • exprBINARY: wyrażenie zawierające szkic wygenerowany przez hll_sketch_agg.

Zwraca

BIGINT Wartość, która jest przybliżoną unikatową liczbą reprezentowaną przez szkic wejściowy.

Przykłady

> SELECT hll_sketch_estimate(hll_sketch_agg(col, 12))
    FROM VALUES (1), (1), (2), (2), (3) tab(col);
  3

> SELECT hll_sketch_estimate(hll_sketch_agg(col))
    FROM VALUES (1), (1), (2), (2), (3) tab(col);
  3