granularity Modul

Enthält Granularitätsdefinitionen für Zeit und Ort.

Die Granularitäten sind wie folgt strukturiert:

Sie verwenden eine Granularität, indem Sie sie in einer Anreicherungsfunktion angeben. Wenn Sie beispielsweise die HolidayEnricherKlassenmethoden zum Anreichern von Daten verwenden, geben Sie TimeGranularity als Eingabeparameter für die Methode an.

Klassen

DayGranularity

Definiert eine Zeitgranularität des Tages.

Granularity

Definiert die Basis-Granularitätsklasse.

HourGranularity

Definiert eine Zeit-Granularität des Tages.

LocationClosestGranularity

Definiert eine nächstgelegene Orts-Granularität.

_cord_count ist die Anzahl der Kundendaten, nachdem Duplikate abgelegt wurden. Wenn sie größer als _cord_limit ist, wird _lower_fuzzy_boundary zum Durchführen der groben Filterung verwendet. Andernfalls wird _upper_fuzzy_boundary verwendet.

Alle möglichen Orte werden nach der räumlichen Entfernung von zwei Orten sortiert. Die _closest_top_n werden ausgewählt, um weitere Joins durchzuführen.

Initialisieren Sie mit verschiedenen Konfigurationen.

cord_count ist die Anzahl der customer_data nach dropDuplicates(), wenn sie größer als _cord_limit ist, verwenden wir _lower_fuzzy_boundary, um die grobe Filterung durchzuführen, andernfalls verwenden Sie _upper_fuzzy_boundary. Alle möglichen Standorte werden nach der sphärischen Entfernung von zwei Standorten bewertet. Wir wählen _closest_top_n aus, um weitere Verknüpfungen durchzuführen.

LocationGranularity

Definiert die Granularität der Basisadresse.

MonthGranularity

Definiert eine Zeit-Granularität des Monats.

TimeGranularity

Definiert die Basisklasse für Zeit-Granularität.