AggregatorTop 类

定义一个聚合器,它根据联接键获取前 N 个。

使用数字进行初始化。

继承
AggregatorTop

构造函数

AggregatorTop(n: int = 1)

参数

名称 说明
n
默认值: 1

注解

通常不会直接实例化聚合器。 而是在使用扩充器(如 HolidayEnricher 对象)时指定聚合器的类型。

process_public_dataset(env, _public_dataset, cols, join_keys) 方法获取最大值。

方法

get_log_property

获取日志属性元组,如果没有属性,则获取 None。

process_public_dataset

根据输入联接键获取前 N 个值。

get_log_property

获取日志属性元组,如果没有属性,则获取 None。

get_log_property()

process_public_dataset

根据输入联接键获取前 N 个值。

process_public_dataset(env: SparkEnv | PandasEnv, _public_dataset: object, cols: object, join_keys: list)

参数

名称 说明
env
必需

运行时环境。

_public_dataset
必需

输入公共数据集。

cols
必需

要检索的列名列表。

join_keys
必需

联接键对的列表。

返回

类型 说明

聚合的公共数据集。