hll_merge() (agregační funkce)
Platí pro: ✅Microsoft Fabric✅Azure Data Explorer✅Azure Monitor✅Microsoft Sentinel
Sloučí výsledky HLL napříč skupinou do jedné hodnoty HLL.
Poznámka:
Hodnoty hll vytvořené pomocí různých hodnot přesnosti nelze sloučit. Další informace najdete v tématu hll().
Další informace najdete v podkladovém algoritmu (HyperLog Log) a přesnost odhadu.
Důležité
Výsledky hll(), hll_if() a hll_merge() je možné uložit a později načíst. Můžete například chtít vytvořit denní souhrn jedinečných uživatelů, který se pak dá použít k výpočtu týdenních počtů. Přesné binární znázornění těchto výsledků se však může v průběhu času změnit. Neexistuje žádná záruka, že tyto funkce budou mít identické výsledky pro stejné vstupy, a proto nedoporučujeme spoléhat se na ně.
Syntaxe
hll_merge
(
hll)
Přečtěte si další informace o konvencích syntaxe.
Parametry
Název | Type | Požadováno | Popis |
---|---|---|---|
hll | string |
✔️ | Název sloupce obsahující hodnoty HLL, které chcete sloučit. |
Návraty
Funkce vrátí sloučené hodnoty HLL v rámci skupiny.
Tip
Pomocí funkce dcount_hll můžete vypočítat dcount
agregační funkce hll() a hll_merge().
Příklad
Následující příklad ukazuje výsledky HLL ve skupině sloučené do jedné hodnoty HLL.
StormEvents
| summarize hllRes = hll(DamageProperty) by bin(StartTime,10m)
| summarize hllMerged = hll_merge(hllRes)
Výstup
Výsledky zobrazují pouze prvních pět výsledků v poli.
hllMerged |
---|
[[1024,14],["-6903255281122589438","-7413697181929588220","-2396604341988936699","5824198135224880646","-6257421034880415225", ...],[]] |
Přesnost odhadu
Tato funkce používá variantu algoritmu HyperLogLog (HLL), který provede stochastický odhad kardinality sady. Algoritmus poskytuje "knoflík", který lze použít k vyvážení přesnosti a doby provádění na velikost paměti:
Přesnost | Chyba (%) | Počet položek |
---|---|---|
0 | 1.6 | 212 |
0 | 0,8 | 214 |
2 | 0,4 | 216 |
3 | 0,28 | 217 |
4 | 0,2 | 218 |
Poznámka:
Sloupec "entry count" je počet čítačů 1 bajtů v implementaci HLL.
Algoritmus obsahuje některá ustanovení pro dosažení dokonalého počtu (nula chyb), pokud je nastavená kardinalita dostatečně malá:
- Pokud je
1
úroveň přesnosti , vrátí se 1 000 hodnot. - Pokud je
2
úroveň přesnosti , vrátí se 8 000 hodnot.
Svázaná chyba je pravděpodobnostní, nikoli teoretická mez. Hodnota je směrodatná odchylka rozdělení chyb (sigma) a 99,7 % odhadů bude mít relativní chybu pod 3 x sigma.
Následující obrázek znázorňuje funkci rozdělení pravděpodobnosti relativní chyby odhadu v procentech pro všechna podporovaná nastavení přesnosti: