OpenDatasetBase Klasse
Offene Dataset-Basisklasse zur Vererbung.
Erstellen sie geöffnete Datasets.
- Vererbung
-
OpenDatasetBase
Konstruktor
OpenDatasetBase(cols: List[str] | None = None, enable_telemetry: bool = True, **kwargs)
Parameter
Name | Beschreibung |
---|---|
cols
|
Eine Liste von Spaltennamen, die aus dem Dataset geladen werden sollen. Standardwert ist "Keine". Standardwert: None
|
enable_telemetry
|
Gibt an, ob Telemetriedaten für dieses Dataset aktiviert werden sollen, standardmäßig true. Standardwert: True
|
kwargs
Erforderlich
|
Args für Filter |
Methoden
get_file_dataset |
Abrufen des Dateidatasets für das offene Dataset. |
get_tabular_dataset |
Initialisieren von AbstractTabularOpenDataset mit einer Blob-URL. |
to_pandas_dataframe |
Zu Pandas-Datenrahmen. |
to_spark_dataframe |
Zu Spark-Datenrahmen. |
get_file_dataset
Abrufen des Dateidatasets für das offene Dataset.
get_file_dataset(start_date: datetime = None, end_date: datetime = None, enable_telemetry: bool = True, **kwargs) -> FileDataset
Parameter
Name | Beschreibung |
---|---|
cls
Erforderlich
|
Aktuelle Klasse |
start_date
Erforderlich
|
Startdatum, Standardwert „None“ |
end_date
Erforderlich
|
Enddatum, Standardwert „None“ |
enable_telemetry
Erforderlich
|
Telemetrie aktivieren oder nicht, Standardwert „True“ |
Gibt zurück
Typ | Beschreibung |
---|---|
Dateidataset |
get_tabular_dataset
Initialisieren von AbstractTabularOpenDataset mit einer Blob-URL.
get_tabular_dataset(start_date: datetime = None, end_date: datetime = None, cols: List[str] = None, enable_telemetry: bool = True, **kwargs) -> TabularDataset
Parameter
Name | Beschreibung |
---|---|
cls
Erforderlich
|
Typname des offenen Dataset. |
start_date
Erforderlich
|
Das Startdatum, das inklusiv abgefragt werden soll. |
end_date
Erforderlich
|
Das Enddatum, das inklusiv abgefragt werden soll. |
cols
Erforderlich
|
Eine Liste abzurufender Spaltennamen. Mit None werden alle Spalten abgerufen. |
enable_telemetry
Erforderlich
|
Gibt an, ob Telemetrie aktiviert werden soll. Ist bei ausschließlicher Benutzertelemetrie deaktiviert. |
Gibt zurück
Typ | Beschreibung |
---|---|
TabularDataset |
to_pandas_dataframe
Zu Pandas-Datenrahmen.
to_pandas_dataframe() -> DataFrame
to_spark_dataframe
Zu Spark-Datenrahmen.
to_spark_dataframe()
Attribute
cols
Ruft die abzurufende Spaltennamenliste ab.
data
Ruft die Daten des OpenDataset-Objekts ab.
id
Ruft die Speicherort-ID der offenen Daten ab.
log_properties
Abrufen der Protokolleigenschaften.
registry_id
Ruft die Registrierungs-ID dieses öffentlichen Datasets ab, das im Back-End registriert ist.
Diese Registrierungs-ID wird verwendet, um die neuesten Metadaten wie den Speicherort abzurufen. Alle öffentlichen Datenunterklassen sollten _registry_id zuweisen.
Gibt zurück
Typ | Beschreibung |
---|---|
Registrierungs-ID-Zeichenfolge. |
time_column_name
Name der Zeitspalte.