Partager via


hll_merge()

S’applique à : ✅Microsoft Fabric✅Azure Data ExplorerAzure MonitorMicrosoft Sentinel

Fusionne les résultats HLL. Il s’agit de la version scalaire de la version hll_merge()d’agrégation.

En savoir plus sur l’algorithme sous-jacent (HyperLogog) et la précision de l’estimation.

Important

Les résultats de hll(), de hll_if() et de hll_merge() peuvent être stockés et récupérés ultérieurement. Par exemple, vous pouvez créer un résumé quotidien des utilisateurs uniques, qui peut ensuite être utilisé pour calculer les nombres hebdomadaires. Toutefois, la représentation binaire précise de ces résultats peut changer au fil du temps. Il n’existe aucune garantie que ces fonctions produisent des résultats identiques pour les entrées identiques, et par conséquent, nous ne conseillons pas de s’appuyer sur eux.

Syntaxe

hll_merge(Hll, hll2, [ hll3, ... ])

En savoir plus sur les conventions de syntaxe.

Paramètres

Nom Type Requise Description
hll, hll2, ... string ✔️ Noms de colonnes contenant des valeurs HLL à fusionner. La fonction attend entre 2 et 64 arguments.

Retours

Retourne une valeur HLL. La valeur est le résultat de la fusion des colonnes hll, hll2, ... hllN.

Exemples

Cet exemple montre la valeur des colonnes fusionnées.

range x from 1 to 10 step 1 
| extend y = x + 10
| summarize hll_x = hll(x), hll_y = hll(y)
| project merged = hll_merge(hll_x, hll_y)
| project dcount_hll(merged)

Sortie

dcount_hll_merged
20

Exactitude d’estimation

Cette fonction utilise une variante de l’algorithme HyperLogLog (HLL), qui effectue une estimation stochastique de la cardinalité définie. L’algorithme fournit un « bouton » qui peut être utilisé pour équilibrer la précision et la durée d’exécution par taille de mémoire :

Précision Erreur (%) Nombre d’entrées
0 1.6 212
1 0,8 214
2 0.4 216
3 0,28 217
4 0.2 218

Remarque

La colonne « Nombre d’entrées » indique le nombre de compteurs sur 1 octet dans l’implémentation de HLL.

L’algorithme inclut certaines dispositions pour effectuer un décompte parfait (zéro erreur) si la cardinalité définie est suffisamment petite :

  • Lorsque le niveau d’exactitude est 1, 1 000 valeurs sont retournées
  • Lorsque le niveau d’exactitude est 2, 8 000 valeurs sont retournées

La limite d’erreur est probabiliste, non théorique. La valeur est l’écart type de distribution des erreurs (sigma), et 99,7 % des estimations auront une erreur relative inférieure à 3 x sigma.

L’illustration suivante montre la fonction de distribution des probabilités de l’erreur d’estimation relative, en pourcentage, pour tous les paramètres d’exactitude pris en charge :

Graphique montrant la distribution des erreurs hll.