Funkcja hll_sketch_estimate
Dotyczy: Databricks SQL Databricks Runtime 13.3 LTS i nowsze
Ta funkcja wykorzystuje algorytm HyperLogLog do zliczania probabilistycznego przybliżenia liczby unikatowych wartości w danej kolumnie, wykorzystując reprezentację binarną znaną jako bufor szkicu wygenerowany wcześniej przez funkcję hll_sketch_agg i zwracając wynik jako dużą liczbę całkowitą.
Funkcje hll_union i hll_union_agg mogą również łączyć szkice, zużywając i scalając te jako dane wejściowe.
Implementacja używa biblioteki Apache Datasketches. Aby uzyskać więcej informacji, zobacz HLL .
Składnia
hll_sketch_estimate ( expr )
Argumenty
expr
BINARY
: wyrażenie zawierające szkic wygenerowany przez hll_sketch_agg.
Zwraca
BIGINT
Wartość, która jest przybliżoną unikatową liczbą reprezentowaną przez szkic wejściowy.
Przykłady
> SELECT hll_sketch_estimate(hll_sketch_agg(col, 12))
FROM VALUES (1), (1), (2), (2), (3) tab(col);
3
> SELECT hll_sketch_estimate(hll_sketch_agg(col))
FROM VALUES (1), (1), (2), (2), (3) tab(col);
3