hll_merge()
Aplica-se a: ✅Microsoft Fabric✅Azure Data Explorer✅Azure Monitor✅Microsoft Sentinel
Mescla os resultados do HLL. Esta é a versão escalar da versão hll_merge()
agregada .
Leia sobre o algoritmo subjacente (HyperLogLog) e a precisão da estimativa.
Importante
Os resultados de hll(), hll_if() e hll_merge() podem ser armazenados e recuperados posteriormente. Por exemplo, você pode criar um resumo diário de usuários únicos, que pode ser usado para calcular contagens semanais. No entanto, a representação binária precisa desses resultados pode mudar com o tempo. Não há garantia de que essas funções produzirão resultados idênticos para entradas idênticas e, portanto, não recomendamos confiar nelas.
Sintaxe
hll_merge(
Hll,
hll2,
[ hll3,
... ])
Saiba mais sobre as convenções de sintaxe.
Parâmetros
Nome | Digitar | Obrigatória | Descrição |
---|---|---|---|
HLL, HLL2, ... | string |
✔️ | Os nomes de coluna que contêm valores HLL a serem mesclados. A função espera entre 2 e 64 argumentos. |
Devoluções
Retorna um valor HLL. O valor é o resultado da mesclagem das colunas hll, hll2, ... hllN.
Exemplos
Este exemplo mostra o valor das colunas mescladas.
range x from 1 to 10 step 1
| extend y = x + 10
| summarize hll_x = hll(x), hll_y = hll(y)
| project merged = hll_merge(hll_x, hll_y)
| project dcount_hll(merged)
Saída
dcount_hll_merged |
---|
20 |
Precisão da estimativa
Essa função usa uma variante do algoritmo HyperLogLog (HLL), que faz uma estimativa estocástica da cardinalidade do conjunto. O algoritmo oferece um "botão" que pode ser usado para balancear a precisão e o tempo de execução por tamanho de memória:
Precisão | Erro (%) | Contagem de entradas |
---|---|---|
0 | 1.6 | 212 |
1 | 0,8 | 214 |
2 | 0,4 | 216 |
3 | 0,28 | 217 |
4 | 0,2 | 218 |
Observação
A coluna "contagem de entradas" é o número de contadores de 1 byte na implementação de HLL.
O algoritmo inclui algumas provisões para fazer uma contagem perfeita (erro zero), se a cardinalidade definida for pequena o suficiente:
- Quando o nível de precisão é
1
, mil valores são retornados - Quando o nível de precisão é
2
, 8 mil valores são retornados
O erro associado é probabilístico, não um associado teórico. O valor é o desvio padrão da distribuição de erros (o sigma) e 99,7% das estimativas terão um erro relativo de menos de 3 x sigma.
A seguinte imagem mostra a função de distribuição de probabilidade do erro de estimativa relativa, em percentuais, para todas as configurações de precisão com suporte: