dcount_hll()

적용 대상: ✅Microsoft Fabric ✅Azure Data Explorer✅Azure Monitor ✅Microsoft Sentinel

hll 또는 hll_merge 생성된 결과에서 고유 개수를 계산합니다.

기본 알고리즘(H yperL ogLog) 및 추정 정확도에 대해 알아봅니다.

구문

dcount_hll(hll)

이름	Type	필수	설명
hll	`string`	✔️	고유 개수를 찾는 데 사용할 hll 또는 hll 병합에서 생성된 식입니다.

hll에서 각 값의 고유 개수를 반환합니다.

다음 예제에서는 고유 개수 hll 병합 결과를 보여 있습니다.

StormEvents
| summarize hllRes = hll(DamageProperty) by bin(StartTime,10m)
| summarize hllMerged = hll_merge(hllRes)
| project dcount_hll(hllMerged)

출력

dcount_hll_hllMerged
315

이 함수는 집합 카디널리티의 확률적 추정을 수행하는 HLL(HyperLogLog) 알고리즘의 변형을 사용합니다. 알고리즘은 메모리 크기당 정확도 및 실행 시간의 균형을 맞추는 데 사용할 수 있는 "노브"를 제공합니다.

참고 항목

"항목 수" 열은 HLL 구현에서 1 바이트 카운터의 수입니다.

알고리즘에는 집합 카디널리티가 충분히 작은 경우 완벽한 개수(오류 0개)를 수행하기 위한 몇 가지 프로비저닝이 포함됩니다.

바인딩된 오류는 이론적 바운드가 아닌 확률입니다. 값은 오류 분포의 표준 편차(시그마)이며 예측의 99.7%는 3 x 시그마 미만의 상대 오차를 갖습니다.

다음 이미지는 지원되는 모든 정확도 설정에 대한 상대 예측 오류의 확률 분포 함수를 백분율로 보여 줍니다.

hll 오류 분포를 보여 주는 그래프입니다.