Freigeben über


NycTlcGreen Klasse

Represents the NYC Taxi & Limousine Commission green taxi trip public dataset.

Datensätze zu Fahrten mit grünen Taxis enthalten Felder mit Datum/Uhrzeit für Abholung und Ankunft, Start- und Zielort, zurückgelegten Entfernungen, Einzelkosten, Tarifarten, Zahlungsarten und vom Fahrer gemeldeten Fahrgastzahlen. Weitere Informationen zu diesem Dataset, einschließlich Spaltenbeschreibungen, verschiedenen Zugriffsmöglichkeiten auf das Dataset und Beispiele, finden Sie unter NYC Taxi & Limousine Commission – Green Taxi Trip Records im Microsoft Azure Open Datasets-Katalog.

Ein Beispiel für die Verwendung der NycTlcGreen-Klasse finden Sie im Tutorial Vorhersagen von Preisen für Taxifahrten mit automatisiertem maschinellem Lernen.

Initialisieren sie Filterfelder.

Vererbung
azureml.opendatasets._nyc_taxi_base.NycTaxiBase
NycTlcGreen

Konstruktor

NycTlcGreen(start_date: datetime = datetime.datetime(2015, 1, 1, 0, 0), end_date: datetime = datetime.datetime(2024, 8, 15, 0, 0), cols: List[str] | None = None, limit: int | None = -1, enable_telemetry: bool = True)

Parameter

Name Beschreibung
start_date

Das Datum, an dem mit dem Laden von Daten begonnen werden soll (einschließlich). Bei „None“ wird das default_start_date verwendet.

Standardwert: 2015-01-01 00:00:00
end_date

Das Datum, an dem das Laden von Daten beendet werden soll (einschließlich). Bei „None“ wird das default_end_date verwendet.

Standardwert: 2024-08-15 00:00:00
cols

Eine Liste der Spaltennamen, die aus dem Dataset geladen werden sollen. Wenn „None“ angezeigt wird, werden alle Spalten geladen. Informationen zu den verfügbaren Spalten in diesem Dataset finden Sie unter NYC Taxi & Limousine Commission – Green Taxi Trip Records.

Standardwert: None
limit
int

Ein Wert, der die Anzahl von Tagen angibt, für die Daten mit to_pandas_dataframe() geladen werden sollen. Wenn keine Angabe erfolgt, wird der Standardwert –1 verwendet, bei dem für die Anzahl geladener Tage keine Beschränkung gilt.

Standardwert: -1
enable_telemetry

Gibt an, ob Telemetriedaten für dieses Dataset aktiviert werden sollen

Standardwert: True
start_date
Erforderlich

Das Startdatum, das Sie inklusiv abfragen möchten.

end_date
Erforderlich

Das Enddatum, das Sie inklusive abfragen möchten.

cols
Erforderlich

Eine Liste der Spaltennamen, die Sie abrufen möchten. Mit None werden alle Spalten abgerufen.

limit
Erforderlich
int

to_pandas_dataframe() lädt nur "limit" Monate an Daten. Der Wert "-1" bedeutet, dass es keine Begrenzung gibt.

enable_telemetry
Erforderlich

Gibt an, ob Telemetriedaten gesendet werden sollen.

Hinweise

Im Beispiel unten wird gezeigt, wie auf dieses Dataset zugegriffen werden kann.


   from azureml.opendatasets import NycTlcGreen
   from dateutil import parser

   end_date = parser.parse('2018-06-06')
   start_date = parser.parse('2018-05-01')
   nyc_tlc = NycTlcGreen(start_date=start_date, end_date=end_date)
   nyc_tlc_df = nyc_tlc.to_pandas_dataframe()