LocationClosestSelector 类

使用最接近的球面距离的标准来定义客户数据与公共数据的联接。

使用位置粒度进行初始化。

继承
LocationClosestSelector

构造函数

LocationClosestSelector(_granularity: LocationClosestGranularity, enable_telemetry: bool = True)

参数

名称 说明
_granularity
必需

要用于数据联接的位置粒度。

enable_telemetry

指示是否启用遥测。

默认值: True

注解

静态方法 process(self, env, customer_data, public_data, aggregator, join_keys, debug) 用于基于此选择器联接数据,其中:

  • customer_data 是 azureml.opendatasets.accessories.location_data.LocationData 的实例

  • public_data 是 azureml.opendatasets.accessories.location_data.LocationData 的实例

  • aggregator 是azureml.opendatasets.aggregators.aggregator.Aggregator 之一

  • join_keys 是联接键对的列表

  • debug 指示是否要打印调试日志。

此方法返回一个元组:更改的客户数据类实例、更改的公共数据类实例和连接密钥对列表。

方法

process

使用指定的聚合器连接客户数据和公共数据。

process

使用指定的聚合器连接客户数据和公共数据。

process(env: SparkEnv | PandasEnv, customer_data: LocationData, public_data: LocationData, aggregator: Aggregator, join_keys: list, debug: bool)

参数

名称 说明
env
必需

运行时环境。

customer_data
必需

LocationData 派生类的实例。

public_data
必需

LocationData 派生类的实例。

aggregator
必需

聚合器。

join_keys
必需

联接键对的列表。

debug
必需

指示是否要打印调试日志。

返回

类型 说明

一个元组:更改的客户数据类实例、更改的公共数据类实例和联接键对的列表。