hll_union_agg
Función
Se aplica a Databricks SQL Databricks Runtime 13.3 LTS y versiones posteriores
Esta función utiliza el algoritmo HyperLogLog para combinar un grupo de bocetos en uno solo.
Las consultas pueden usar los búferes resultantes para calcular recuentos únicos aproximados con la función hll_sketch_estimate.
La implementación usa la Biblioteca Apache Datasketches. Para obtener más información, consulte HLL.
Sintaxis
hll_union_agg ( expr [, allowDifferentLgConfigK ] )
Esta función también se puede invocar como una función de ventana mediante la cláusula OVER
.
Argumentos
expr
: Una expresiónBINARY
que contiene un boceto generado por hll_sketch_agg.allowDifferentLgConfigK
: Una expresión constante opcionalBOOLEAN
que controla si se permite fusionar bocetos con valores lgConfigK diferentes. El valor predeterminado es falso.
Devoluciones
Un BINARY
búfer que contiene el boceto de HyperLogLog calculado como resultado de combinar las expresiones de entrada.
Cuando el allowDifferentLgConfigK
parámetro es true, el boceto de resultados usa el menor de los dos valores proporcionados lgConfigK
.
Ejemplos
> SELECT hll_sketch_estimate(hll_union_agg(sketch, true))
FROM (SELECT hll_sketch_agg(col) as sketch
FROM VALUES (1) AS tab(col)
UNION ALL
SELECT hll_sketch_agg(col, 20) as sketch
FROM VALUES (1) AS tab(col));
1
> SELECT hll_sketch_estimate(hll_union_agg(sketch, false))
FROM (SELECT hll_sketch_agg(col) as sketch
FROM VALUES (1) AS tab(col)
UNION ALL
SELECT hll_sketch_agg(col, 20) as sketch
FROM VALUES (1) AS tab(col));
error