Funzione hll_sketch_estimate
Si applica a: Databricks SQL
Databricks Runtime 13.3 LTS e versioni successive
Questa funzione utilizza l'algoritmo HyperLogLog per calcolare un'approssimazione probabilistica del numero di valori univoci in una determinata colonna, utilizzando una rappresentazione binaria nota come buffer di sketch generata in precedenza dalla funzione hll_sketch_agg e restituendo il risultato come un grande numero intero.
Le funzioni hll_union e hll_union_agg possono anche combinare gli schizzi utilizzando e unendo questi buffer come input.
L'implementazione usa la libreria Apache Datasketches. Per altre informazioni, vedere HLL .
Sintassi
hll_sketch_estimate ( expr )
Argomenti
-
expr
BINARY
: espressione che contiene uno schizzo generato da hll_sketch_agg.
Valori restituiti
Valore BIGINT
che corrisponde al conteggio distinto approssimativo indicato dallo schizzo di input.
Esempi
> SELECT hll_sketch_estimate(hll_sketch_agg(col, 12))
FROM VALUES (1), (1), (2), (2), (3) tab(col);
3
> SELECT hll_sketch_estimate(hll_sketch_agg(col))
FROM VALUES (1), (1), (2), (2), (3) tab(col);
3