LocationClosestGranularity Klasa
Definiuje stopień szczegółowości najbliższej lokalizacji.
_cord_count
to liczba danych klientów po usunięciu duplikatów. Jeśli jest on większy niż _cord_limit
, _lower_fuzzy_boundary
jest używany do filtrowania szorstkiego, _upper_fuzzy_boundary
w przeciwnym razie jest używany.
Wszystkie możliwe lokalizacje będą klasyfikowane według odległości sferycznej dwóch lokalizacji. _closest_top_n
Te lokalizacje są wybierane do wykonania dalszych sprzężeń.
Zainicjuj przy użyciu różnych konfiguracji.
cord_count to liczba customer_data po dropDuplicates(), jeśli jest większa niż _cord_limit, użyjemy _lower_fuzzy_boundary, aby wykonać filtrowanie szorstkie, w przeciwnym razie użyjemy _upper_fuzzy_boundary. Wszystkie możliwe lokalizacje będą klasyfikowane według odległości sferycznej dwóch lokalizacji. Wybierzemy _closest_top_n, aby wykonać dalsze sprzężenie.
- Dziedziczenie
-
LocationClosestGranularity
Konstruktor
LocationClosestGranularity(_cord_limit=5, _lower_fuzzy_boundary=2, _upper_fuzzy_boundary=5, _closest_top_n=1)
Parametry
Nazwa | Opis |
---|---|
_cord_limit
|
Liczba danych klientów po usunięciu duplikatów. Wartość domyślna to 5. Domyślna wartość: 5
|
_lower_fuzzy_boundary
|
Dolna granica filtrowania. Wartość domyślna to 2 Domyślna wartość: 2
|
_upper_fuzzy_boundary
|
Górna granica do filtrowania. Wartość domyślna to 5 Domyślna wartość: 5
|
_closest_top_n
|
Ile najlepszych dopasowań należy wziąć pod uwagę najbliżej. Wartość domyślna to 1. Im większa wartość, tym większy koszt czasu. Domyślna wartość: 1
|
_cord_limit
Wymagane
|
wartość domyślna to 5 |
_lower_fuzzy_boundary
Wymagane
|
wartość domyślna to 2 |
_upper_fuzzy_boundary
Wymagane
|
wartość domyślna to 5 |
_closest_top_n
Wymagane
|
wartość domyślna to 1, tym większy, tym większy koszt czasu. |
Metody
get_log_property |
Pobierz krotkę właściwości dziennika, Brak, jeśli nie ma właściwości. |
get_log_property
Pobierz krotkę właściwości dziennika, Brak, jeśli nie ma właściwości.
get_log_property()