Freigeben über


OpenDatasetBase Klasse

Offene Dataset-Basisklasse zur Vererbung.

Erstellen sie geöffnete Datasets.

Vererbung
OpenDatasetBase

Konstruktor

OpenDatasetBase(cols: List[str] | None = None, enable_telemetry: bool = True, **kwargs)

Parameter

Name Beschreibung
cols

Eine Liste von Spaltennamen, die aus dem Dataset geladen werden sollen. Standardwert ist "Keine".

Standardwert: None
enable_telemetry

Gibt an, ob Telemetriedaten für dieses Dataset aktiviert werden sollen, standardmäßig true.

Standardwert: True
kwargs
Erforderlich

Args für Filter

Methoden

get_file_dataset

Abrufen des Dateidatasets für das offene Dataset.

get_tabular_dataset

Initialisieren von AbstractTabularOpenDataset mit einer Blob-URL.

to_pandas_dataframe

Zu Pandas-Datenrahmen.

to_spark_dataframe

Zu Spark-Datenrahmen.

get_file_dataset

Abrufen des Dateidatasets für das offene Dataset.

get_file_dataset(start_date: datetime = None, end_date: datetime = None, enable_telemetry: bool = True, **kwargs) -> FileDataset

Parameter

Name Beschreibung
cls
Erforderlich

Aktuelle Klasse

start_date
Erforderlich

Startdatum, Standardwert „None“

end_date
Erforderlich

Enddatum, Standardwert „None“

enable_telemetry
Erforderlich

Telemetrie aktivieren oder nicht, Standardwert „True“

Gibt zurück

Typ Beschreibung

Dateidataset

get_tabular_dataset

Initialisieren von AbstractTabularOpenDataset mit einer Blob-URL.

get_tabular_dataset(start_date: datetime = None, end_date: datetime = None, cols: List[str] = None, enable_telemetry: bool = True, **kwargs) -> TabularDataset

Parameter

Name Beschreibung
cls
Erforderlich

Typname des offenen Dataset.

start_date
Erforderlich

Das Startdatum, das inklusiv abgefragt werden soll.

end_date
Erforderlich

Das Enddatum, das inklusiv abgefragt werden soll.

cols
Erforderlich

Eine Liste abzurufender Spaltennamen. Mit None werden alle Spalten abgerufen.

enable_telemetry
Erforderlich

Gibt an, ob Telemetrie aktiviert werden soll. Ist bei ausschließlicher Benutzertelemetrie deaktiviert.

Gibt zurück

Typ Beschreibung

TabularDataset

to_pandas_dataframe

Zu Pandas-Datenrahmen.

to_pandas_dataframe() -> DataFrame

to_spark_dataframe

Zu Spark-Datenrahmen.

to_spark_dataframe()

Attribute

cols

Ruft die abzurufende Spaltennamenliste ab.

data

Ruft die Daten des OpenDataset-Objekts ab.

id

Ruft die Speicherort-ID der offenen Daten ab.

log_properties

Abrufen der Protokolleigenschaften.

registry_id

Ruft die Registrierungs-ID dieses öffentlichen Datasets ab, das im Back-End registriert ist.

Diese Registrierungs-ID wird verwendet, um die neuesten Metadaten wie den Speicherort abzurufen. Alle öffentlichen Datenunterklassen sollten _registry_id zuweisen.

Gibt zurück

Typ Beschreibung
str

Registrierungs-ID-Zeichenfolge.

time_column_name

Name der Zeitspalte.