LocationClosestSelector 类
使用最接近的球面距离的标准来定义客户数据与公共数据的联接。
使用位置粒度进行初始化。
- 继承
-
LocationClosestSelector
构造函数
LocationClosestSelector(_granularity: LocationClosestGranularity, enable_telemetry: bool = True)
参数
名称 | 说明 |
---|---|
_granularity
必需
|
要用于数据联接的位置粒度。 |
enable_telemetry
|
指示是否启用遥测。 默认值: True
|
注解
静态方法 process(self, env, customer_data, public_data, aggregator, join_keys, debug)
用于基于此选择器联接数据,其中:
customer_data
是 azureml.opendatasets.accessories.location_data.LocationData 的实例public_data
是 azureml.opendatasets.accessories.location_data.LocationData 的实例aggregator
是azureml.opendatasets.aggregators.aggregator.Aggregator 之一join_keys
是联接键对的列表debug
指示是否要打印调试日志。
此方法返回一个元组:更改的客户数据类实例、更改的公共数据类实例和连接密钥对列表。
方法
process |
使用指定的聚合器连接客户数据和公共数据。 |
process
使用指定的聚合器连接客户数据和公共数据。
process(env: SparkEnv | PandasEnv, customer_data: LocationData, public_data: LocationData, aggregator: Aggregator, join_keys: list, debug: bool)
参数
名称 | 说明 |
---|---|
env
必需
|
运行时环境。 |
customer_data
必需
|
LocationData 派生类的实例。 |
public_data
必需
|
LocationData 派生类的实例。 |
aggregator
必需
|
聚合器。 |
join_keys
必需
|
联接键对的列表。 |
debug
必需
|
指示是否要打印调试日志。 |
返回
类型 | 说明 |
---|---|
一个元组:更改的客户数据类实例、更改的公共数据类实例和联接键对的列表。 |