Dela via


hll_merge()

Gäller för: ✅Microsoft FabricAzure Data ExplorerAzure MonitorMicrosoft Sentinel

Sammanfogar HLL-resultat. Det här är den skalära versionen av den aggregerade versionen hll_merge().

Läs mer om underliggande algoritmen (HyperLogLog) och uppskattningsnoggrannhet.

Viktig

Resultatet av hll(), hll_if() och hll_merge() kan lagras och hämtas senare. Du kanske till exempel vill skapa en sammanfattning av dagliga unika användare som sedan kan användas för att beräkna veckoantal. Den exakta binära representationen av dessa resultat kan dock ändras med tiden. Det finns ingen garanti för att dessa funktioner ger identiska resultat för identiska indata, och därför rekommenderar vi inte att du förlitar oss på dem.

Syntax

hll_merge( hll,hll2, [ hll3, ... ])

Läs mer om syntaxkonventioner.

Parametrar

Namn Typ Krävs Beskrivning
hll, hll2, ... string ✔️ Kolumnnamnen som innehåller HLL-värden som ska sammanfogas. Funktionen förväntar sig mellan 2 och 64 argument.

Returnerar

Returnerar ett HLL-värde. Värdet är resultatet av sammanslagning av kolumnerna hll, hll2, ... hllN.

Exempel

Det här exemplet visar värdet för de sammanfogade kolumnerna.

range x from 1 to 10 step 1 
| extend y = x + 10
| summarize hll_x = hll(x), hll_y = hll(y)
| project merged = hll_merge(hll_x, hll_y)
| project dcount_hll(merged)

utdata

dcount_hll_merged
20

Uppskattningsnoggrannhet

Den här funktionen använder en variant av algoritmen HyperLogLog (HLL), som gör en stokastisk uppskattning av uppsättningens kardinalitet. Algoritmen ger en "knopp" som kan användas för att balansera noggrannhet och körningstid per minnesstorlek:

Noggrannhet Fel (%) Antal poster
0 1.6 212
1 0.8 214
2 0.4 216
3 0.28 217
4 0.2 218

Not

Kolumnen "antal poster" är antalet 1 byte-räknare i HLL-implementeringen.

Algoritmen innehåller vissa bestämmelser för att göra ett perfekt antal (noll fel), om den inställda kardinaliteten är tillräckligt liten:

  • När noggrannhetsnivån är 1returneras 1 000 värden
  • När noggrannhetsnivån är 2returneras 8 000 värden

Felgränsen är probabilistisk, inte en teoretisk bindning. Värdet är standardavvikelsen för felfördelningen (sigma) och 99,7% av uppskattningarna har ett relativt fel på under 3 x sigma.

Följande bild visar sannolikhetsfördelningsfunktionen för det relativa uppskattningsfelet, i procent, för alla noggrannhetsinställningar som stöds:

Graph som visar hll-felfördelningen.