LocationClosestGranularity 类

定义最靠近位置粒度。

_cord_count 是删除重复项后的客户数据计数。 如果它大于 _cord_limit,则使用 _lower_fuzzy_boundary 进行粗略筛选,否则使用 _upper_fuzzy_boundary

所有可能的位置都会按两个位置的球面距离进行排序,选择 _closest_top_n 可以执行进一步的联接。

使用各种配置进行初始化。

cord_count是 dropDuplicates () 之后的customer_data计数,如果它大于 _cord_limit,我们将使用 _lower_fuzzy_boundary 进行粗略筛选,否则使用 _upper_fuzzy_boundary。 所有可能的位置都将按两个位置的球面距离进行排名,我们将选择_closest_top_n进行进一步联接。

继承
LocationClosestGranularity

构造函数

LocationClosestGranularity(_cord_limit=5, _lower_fuzzy_boundary=2, _upper_fuzzy_boundary=5, _closest_top_n=1)

参数

名称 说明
_cord_limit
int

客户数据在删除重复项后的的计数。 默认值为 5。

默认值: 5
_lower_fuzzy_boundary
int

用于筛选的下限。 默认值为 2

默认值: 2
_upper_fuzzy_boundary
int

用于筛选的上限。 默认值为 5

默认值: 5
_closest_top_n
int

认为靠前的匹配当中有多少是最接近的。 默认值为 1。 该值越大,花费的时间就越多。

默认值: 1
_cord_limit
必需

默认值为 5

_lower_fuzzy_boundary
必需

默认值为 2

_upper_fuzzy_boundary
必需

默认值为 5

_closest_top_n
必需

默认值为 1,越大,时间成本就越大。

方法

get_log_property

获取日志属性元组,如果没有属性,则获取 None。

get_log_property

获取日志属性元组,如果没有属性,则获取 None。

get_log_property()