Delen via


NycTlcGreen Klas

Vertegenwoordigt de openbare gegevensset nyc taxi & Limousine Commission groene taxirit.

De groene taxiritrecords bevatten velden met de datums/tijden waarop passagiers zijn opgehaald en afgezet, locaties voor ophalen en afzetten, ritafstanden, in items verdeelde tarieven, tarieftypen, betalingstypen en door de chauffeur gerapporteerde passagiersaantallen. Zie NYC Taxi & Limousine Commission - groene taxiritrecords in de microsoft Azure Open Datasets-catalogus voor meer informatie over deze gegevensset, waaronder kolombeschrijvingen, verschillende manieren om toegang te krijgen tot de gegevensset en voorbeelden.

Zie de zelfstudie Geautomatiseerde machine learning gebruiken om taxitarieven te voorspellen voor een voorbeeld van het gebruik van de klasse NycTlcGreen.

Filtervelden initialiseren.

Overname
azureml.opendatasets._nyc_taxi_base.NycTaxiBase
NycTlcGreen

Constructor

NycTlcGreen(start_date: datetime = datetime.datetime(2015, 1, 1, 0, 0), end_date: datetime = datetime.datetime(2024, 10, 18, 0, 0), cols: List[str] | None = None, limit: int | None = -1, enable_telemetry: bool = True)

Parameters

Name Description
start_date

De datum waarop wordt gestart met het laden van gegevens, inclusief. Indien Geen, wordt de default_start_date gebruikt.

Default value: 2015-01-01 00:00:00
end_date

De datum waarop het laden van gegevens wordt beƫindigd, inclusief. Indien Geen, wordt de default_end_date gebruikt.

Default value: 2024-10-18 00:00:00
cols

Een lijst met kolomnamen die uit de gegevensset moeten worden geladen. Indien Geen, worden alle kolommen geladen. Zie NYC Taxi & Limousine Commission - groene taxiritrecords voor informatie over de beschikbare kolommen in deze gegevensset.

Default value: None
limit
int

Een waarde die het aantal dagen aangeeft dat gegevens moeten worden geladen met to_pandas_dataframe(). Als dit niet is opgegeven, betekent de standaardwaarde -1 geen limiet voor het laden van dagen.

Default value: -1
enable_telemetry

Hiermee wordt aangegeven of telemetrie moet worden ingeschakeld voor deze gegevensset.

Default value: True
start_date
Vereist

De begindatum die u inclusief wilt opvragen.

end_date
Vereist

De einddatum die u inclusief wilt opvragen.

cols
Vereist

Een lijst met kolomnamen die u wilt ophalen. Geen krijgt alle kolommen.

limit
Vereist
int

to_pandas_dataframe() laadt alleen 'limiet' maanden aan gegevens. -1 betekent geen limiet.

enable_telemetry
Vereist

Geeft aan of telemetrie moet worden verzonden.

Opmerkingen

In het onderstaande voorbeeld ziet u hoe u toegang hebt tot de gegevensset.


   from azureml.opendatasets import NycTlcGreen
   from dateutil import parser

   end_date = parser.parse('2018-06-06')
   start_date = parser.parse('2018-05-01')
   nyc_tlc = NycTlcGreen(start_date=start_date, end_date=end_date)
   nyc_tlc_df = nyc_tlc.to_pandas_dataframe()