Udostępnij za pośrednictwem


LocationClosestGranularity Klasa

Definiuje stopień szczegółowości najbliższej lokalizacji.

_cord_count to liczba danych klientów po usunięciu duplikatów. Jeśli jest on większy niż _cord_limit, _lower_fuzzy_boundary jest używany do filtrowania szorstkiego, _upper_fuzzy_boundary w przeciwnym razie jest używany.

Wszystkie możliwe lokalizacje będą klasyfikowane według odległości sferycznej dwóch lokalizacji. _closest_top_n Te lokalizacje są wybierane do wykonania dalszych sprzężeń.

Zainicjuj przy użyciu różnych konfiguracji.

cord_count to liczba customer_data po dropDuplicates(), jeśli jest większa niż _cord_limit, użyjemy _lower_fuzzy_boundary, aby wykonać filtrowanie szorstkie, w przeciwnym razie użyjemy _upper_fuzzy_boundary. Wszystkie możliwe lokalizacje będą klasyfikowane według odległości sferycznej dwóch lokalizacji. Wybierzemy _closest_top_n, aby wykonać dalsze sprzężenie.

Dziedziczenie
LocationClosestGranularity

Konstruktor

LocationClosestGranularity(_cord_limit=5, _lower_fuzzy_boundary=2, _upper_fuzzy_boundary=5, _closest_top_n=1)

Parametry

Nazwa Opis
_cord_limit
int

Liczba danych klientów po usunięciu duplikatów. Wartość domyślna to 5.

Domyślna wartość: 5
_lower_fuzzy_boundary
int

Dolna granica filtrowania. Wartość domyślna to 2

Domyślna wartość: 2
_upper_fuzzy_boundary
int

Górna granica do filtrowania. Wartość domyślna to 5

Domyślna wartość: 5
_closest_top_n
int

Ile najlepszych dopasowań należy wziąć pod uwagę najbliżej. Wartość domyślna to 1. Im większa wartość, tym większy koszt czasu.

Domyślna wartość: 1
_cord_limit
Wymagane

wartość domyślna to 5

_lower_fuzzy_boundary
Wymagane

wartość domyślna to 2

_upper_fuzzy_boundary
Wymagane

wartość domyślna to 5

_closest_top_n
Wymagane

wartość domyślna to 1, tym większy, tym większy koszt czasu.

Metody

get_log_property

Pobierz krotkę właściwości dziennika, Brak, jeśli nie ma właściwości.

get_log_property

Pobierz krotkę właściwości dziennika, Brak, jeśli nie ma właściwości.

get_log_property()