次の方法で共有


AggregatorTop クラス

結合キーに基づいて上位 N 個を取得するアグリゲーターを定義します。

先頭の数値を使用して初期化します。

継承
AggregatorTop

コンストラクター

AggregatorTop(n: int = 1)

パラメーター

名前 説明
n
規定値: 1

注釈

通常、アグリゲーターは直接インスタンス化されません。 そのため、HolidayEnricher オブジェクトなどのエンリッチャーを使用して、アグリゲーターの種類を指定します。

process_public_dataset(env, _public_dataset, cols, join_keys) メソッドは、最大値を取得します。

メソッド

get_log_property

ログ プロパティ タプルを取得します。プロパティがない場合は None です。

process_public_dataset

入力結合キーに基づいて上位 N 個の値を取得します。

get_log_property

ログ プロパティ タプルを取得します。プロパティがない場合は None です。

get_log_property()

process_public_dataset

入力結合キーに基づいて上位 N 個の値を取得します。

process_public_dataset(env: SparkEnv | PandasEnv, _public_dataset: object, cols: object, join_keys: list)

パラメーター

名前 説明
env
必須

ランタイム環境。

_public_dataset
必須

入力パブリック データセット。

cols
必須

取得する列名のリスト。

join_keys
必須

結合キー ペアの一覧。

戻り値

説明

集計済みのパブリック データセット。