LocationClosestGranularity クラス
最も近い場所の細分性を定義します。
_cord_count
は、重複を削除した後の顧客データの数です。 これが _cord_limit
より大きい場合、大まかなフィルター処理を行うために _lower_fuzzy_boundary
が使用されます。それ以外の場合、_upper_fuzzy_boundary
が使用されます。
可能性のあるすべての場所は、2 つの場所の球面距離によってランク付けされ、さらなる結合を行うために _closest_top_n
が選択されます。
さまざまな構成を使用して初期化します。
cord_countは dropDuplicates() の後のcustomer_dataの数です。_cord_limitより大きい場合は、_lower_fuzzy_boundaryを使用して大まかなフィルター処理を行います。それ以外の場合は、_upper_fuzzy_boundaryを使用します。 考えられるすべての場所は、2 つの場所の球面距離でランク付けされます。さらに結合するには、_closest_top_nを選択します。
- 継承
-
LocationClosestGranularity
コンストラクター
LocationClosestGranularity(_cord_limit=5, _lower_fuzzy_boundary=2, _upper_fuzzy_boundary=5, _closest_top_n=1)
パラメーター
名前 | 説明 |
---|---|
_cord_limit
|
重複を削除した後の顧客データの数。 既定値は 5 です。 規定値: 5
|
_lower_fuzzy_boundary
|
フィルター処理の下限。 既定値は 2 です 規定値: 2
|
_upper_fuzzy_boundary
|
フィルター処理の上限。 既定値は 5 です 規定値: 5
|
_closest_top_n
|
最も近いと見なす上位一致の数。 既定値は 1 です。 値が大きいほど、時間コストが増加します。 規定値: 1
|
_cord_limit
必須
|
既定値は 5 です |
_lower_fuzzy_boundary
必須
|
既定値は 2 です |
_upper_fuzzy_boundary
必須
|
既定値は 5 です |
_closest_top_n
必須
|
既定値は 1 で、時間コストが大きいほど大きくなります。 |
メソッド
get_log_property |
ログ プロパティ タプルを取得します。プロパティがない場合は None です。 |
get_log_property
ログ プロパティ タプルを取得します。プロパティがない場合は None です。
get_log_property()