hll_sketch_estimate
関数
適用対象: Databricks SQL Databricks Runtime 13.3 LTS 以降
この関数は、HyperLogLog アルゴリズムを利用して、特定の列内の一意の値の数の確率的近似値をカウントし、 hll_sketch_agg 関数によって以前に生成されたスケッチ バッファーと呼ばれるバイナリ表現を使用し、結果を大きな整数として返します。
hll_union 関数と hll_union_agg 関数では、これらのバッファーを入力として使用し、マージすることでスケッチを結合することもできます。
実装では、Apache Datasketches ライブラリを使用します。 詳細については、「HLL」を参照してください。
構文
hll_sketch_estimate ( expr )
引数
expr
: hll_sketch_agg によって生成されるスケッチを保持するBINARY
式。
返品
入力スケッチによって表されるおおよその個別の数である BIGINT
値。
例
> SELECT hll_sketch_estimate(hll_sketch_agg(col, 12))
FROM VALUES (1), (1), (2), (2), (3) tab(col);
3
> SELECT hll_sketch_estimate(hll_sketch_agg(col))
FROM VALUES (1), (1), (2), (2), (3) tab(col);
3