LocationClosestGranularity 类
定义最靠近位置粒度。
_cord_count
是删除重复项后的客户数据计数。 如果它大于 _cord_limit
,则使用 _lower_fuzzy_boundary
进行粗略筛选,否则使用 _upper_fuzzy_boundary
。
所有可能的位置都会按两个位置的球面距离进行排序,选择 _closest_top_n
可以执行进一步的联接。
使用各种配置进行初始化。
cord_count是 dropDuplicates () 之后的customer_data计数,如果它大于 _cord_limit,我们将使用 _lower_fuzzy_boundary 进行粗略筛选,否则使用 _upper_fuzzy_boundary。 所有可能的位置都将按两个位置的球面距离进行排名,我们将选择_closest_top_n进行进一步联接。
- 继承
-
LocationClosestGranularity
构造函数
LocationClosestGranularity(_cord_limit=5, _lower_fuzzy_boundary=2, _upper_fuzzy_boundary=5, _closest_top_n=1)
参数
名称 | 说明 |
---|---|
_cord_limit
|
客户数据在删除重复项后的的计数。 默认值为 5。 默认值: 5
|
_lower_fuzzy_boundary
|
用于筛选的下限。 默认值为 2 默认值: 2
|
_upper_fuzzy_boundary
|
用于筛选的上限。 默认值为 5 默认值: 5
|
_closest_top_n
|
认为靠前的匹配当中有多少是最接近的。 默认值为 1。 该值越大,花费的时间就越多。 默认值: 1
|
_cord_limit
必需
|
默认值为 5 |
_lower_fuzzy_boundary
必需
|
默认值为 2 |
_upper_fuzzy_boundary
必需
|
默认值为 5 |
_closest_top_n
必需
|
默认值为 1,越大,时间成本就越大。 |
方法
get_log_property |
获取日志属性元组,如果没有属性,则获取 None。 |
get_log_property
获取日志属性元组,如果没有属性,则获取 None。
get_log_property()