granularity 模块

包含时间和位置的粒度定义。

粒度按如下方式组织:

可以通过在扩充器函数中指定粒度来处理粒度。 例如,使用 HolidayEnricher 类方法扩充数据时,将 TimeGranularity 指定为方法的输入参数。

DayGranularity

定义时间粒度“日”。

Granularity

定义基粒度类。

HourGranularity

定义时间粒度“小时”。

LocationClosestGranularity

定义最靠近位置粒度。

_cord_count 是删除重复项后的客户数据计数。 如果它大于 _cord_limit,则使用 _lower_fuzzy_boundary 进行粗略筛选,否则使用 _upper_fuzzy_boundary

所有可能的位置都会按两个位置的球面距离进行排序,选择 _closest_top_n 可以执行进一步的联接。

使用各种配置进行初始化。

cord_count是 dropDuplicates () 之后的customer_data计数,如果它大于 _cord_limit,我们将使用 _lower_fuzzy_boundary 进行粗略筛选,否则使用 _upper_fuzzy_boundary。 所有可能的位置都将按两个位置的球面距离进行排名,我们将选择_closest_top_n进行进一步联接。

LocationGranularity

定义基位置粒度。

MonthGranularity

定义时间粒度“月”。

TimeGranularity

定义时间粒度的基类。