hll_union
Función
Se aplica a Databricks SQL Databricks Runtime 13.3 LTS y versiones posteriores
Esta función utiliza el algoritmo HyperLogLog para combinar dos bocetos en un solo croquis.
Las consultas pueden usar los búferes resultantes para calcular recuentos únicos aproximados con la función hll_sketch_estimate.
La implementación usa la Biblioteca Apache Datasketches. Para obtener más información, consulte HLL.
Sintaxis
hll_union ( expr1, expr2 [, allowDifferentLgConfigK ] )
Argumentos
exprN
: Una expresiónBINARY
que contiene un boceto generado por hll_sketch_agg.allowDifferentLgConfigK
: expresión opcionalBOOLEAN
que controla si se permiten combinar dos bocetos con valores lgConfigK diferentes. El valor predeterminado es falso.
Devoluciones
Un BINARY
búfer que contiene el boceto de HyperLogLog calculado como resultado de combinar las expresiones de entrada.
Cuando el allowDifferentLgConfigK
parámetro es true, el boceto de resultados usa el menor de los dos valores proporcionados lgConfigK
.
Ejemplos
> SELECT hll_sketch_estimate(
hll_union(
hll_sketch_agg(col1),
hll_sketch_agg(col2)))
FROM VALUES
(1, 4),
(1, 4),
(2, 5),
(2, 5),
(3, 6) AS tab(col1, col2);
6
> SELECT hll_sketch_estimate(
hll_union(
hll_sketch_agg(col1, 4),
hll_sketch_agg(col2, 21)))
FROM VALUES
(1, 4),
(1, 4),
(2, 5),
(2, 5),
(3, 6) AS tab(col1, col2);
error