hll_sketch_agg
funkcja agregacji
Dotyczy: Databricks SQL Databricks Runtime 13.3 LTS i nowsze
Ta funkcja wykorzystuje algorytm HyperLogLog do zliczania probabilistycznego przybliżenia liczby unikatowych wartości w danej kolumnie i zwraca wynik jako reprezentację binarną znaną jako bufor szkicu. Ta reprezentacja binarna jest odpowiednia do trwałości.
Zapytania mogą używać wynikowych do obliczania przybliżonych unikatowych liczb za pomocą funkcji hll_sketch_estimate .
Funkcje hll_union i hll_union_agg mogą również łączyć szkice, zużywając i scalając te jako dane wejściowe.
Implementacja używa biblioteki Apache Datasketches. Aby uzyskać więcej informacji, zobacz HLL .
Składnia
hll_sketch_agg ( expr [, lgConfigK ] )
Tę funkcję można również wywołać jako funkcję okna przy użyciu klauzuli OVER
.
Argumenty
expr
: wyrażenie typuINT
, ,BIGINT
STRING
lubBINARY
, względem którego wystąpi unikatowe zliczanie.lgConfigK
: opcjonalnaINT
stała z zakresu od 4 do 21 włącznie z wartością domyślną 12. Log-base-2 z K, gdzie K jest liczbą zasobników lub gniazd dla szkicu.
Dowolny NULL
w pliku expr
jest ignorowany.
Zwraca
NULL
BINARY
Bufor bez buforu zawierającego szkic funkcji HyperLogLog obliczony w wyniku zużywania i agregowania wszystkich wartości wejściowych w grupie agregacji.
Przykłady
> SELECT hll_sketch_estimate(hll_sketch_agg(col, 12))
FROM VALUES (1), (1), (2), (2), (3) tab(col);
3
> SELECT hll_sketch_estimate(hll_sketch_agg(col))
FROM VALUES (1), (1), (2), (2), (3) tab(col);
3