NycTlcGreen Classe
Representa o conjunto de dados públicos da viagem de táxi verde da Comissão de Táxis de NYC & Limousine.
Os registos de corridas de "green taxi" incluem campos que registam as datas/horas de recolha e entrega, as localizações de recolha e entrega, as distâncias das corridas, tarifas discriminadas, tipos de taxas, tipos de pagamentos e contagens de passageiros feitas pelo motorista. Para obter mais informações sobre este conjunto de dados, incluindo descrições de colunas, diferentes formas de aceder ao conjunto de dados e exemplos, veja Nyc Taxi & Comissão limusine - registos de viagens de táxi verdes no catálogo microsoft Azure Open Datasets.
Para obter um exemplo de utilização da classe NycTlcGreen, veja o tutorial Utilizar machine learning automatizado para prever tarifas de táxi.
Inicializar campos de filtragem.
- Herança
-
azureml.opendatasets._nyc_taxi_base.NycTaxiBaseNycTlcGreen
Construtor
NycTlcGreen(start_date: datetime = datetime.datetime(2015, 1, 1, 0, 0), end_date: datetime = datetime.datetime(2024, 8, 15, 0, 0), cols: List[str] | None = None, limit: int | None = -1, enable_telemetry: bool = True)
Parâmetros
Name | Description |
---|---|
start_date
|
A data em que começar a carregar dados, inclusive. Se Não, o Default value: 2015-01-01 00:00:00
|
end_date
|
A data em que os dados são carregados, inclusive. Se Não, o Default value: 2024-08-15 00:00:00
|
cols
|
Uma lista de nomes de colunas a carregar a partir do conjunto de dados. Se Não, todas as colunas são carregadas. Para obter informações sobre as colunas disponíveis neste conjunto de dados, consulte Nyc Taxi & Limousine Commission - green taxi trip records. Default value: None
|
limit
|
Um valor que indica o número de dias de dados a carregar com Default value: -1
|
enable_telemetry
|
Se pretende ativar a telemetria neste conjunto de dados. Default value: True
|
start_date
Necessário
|
A data de início que pretende consultar de forma inclusiva. |
end_date
Necessário
|
A data de fim que pretende consultar de forma inclusiva. |
cols
Necessário
|
Uma lista de nomes de coluna que gostaria de obter. Nenhuma obterá todas as colunas. |
limit
Necessário
|
to_pandas_dataframe() carregará apenas meses "limite" de dados. -1 significa que não há limite. |
enable_telemetry
Necessário
|
Indica se pretende enviar telemetria. |
Observações
O exemplo abaixo mostra como aceder ao conjunto de dados.
from azureml.opendatasets import NycTlcGreen
from dateutil import parser
end_date = parser.parse('2018-06-06')
start_date = parser.parse('2018-05-01')
nyc_tlc = NycTlcGreen(start_date=start_date, end_date=end_date)
nyc_tlc_df = nyc_tlc.to_pandas_dataframe()