Udostępnij za pośrednictwem


NycTlcFhv Klasa

Reprezentuje publiczny zestaw danych NYC Taxi & Limousine Commission.

Ten zestaw danych zawiera rekordy podróży For-Hire vechicle (ROTV), które obejmują pola przechwytujące podstawowy numer licencji oraz datę odbioru, godzinę i identyfikator lokalizacji strefy taksówek (plik kształtu poniżej). Te rekordy są generowane na podstawie danych przesyłanych do systemu FHV Trip Record przez centrale. Aby uzyskać więcej informacji na temat tego zestawu danych, w tym opisów kolumn, różnych sposobów uzyskiwania dostępu do zestawu danych i przykładów, zobacz NYC Taxi & Limousine Commission — For-Hire Vehicle (PRZEV) rekordy podróży w katalogu zestawów danych Platformy Microsoft Azure Open.

Inicjowanie pól filtrowania.

Dziedziczenie
azureml.opendatasets._nyc_taxi_base.NycTaxiBase
NycTlcFhv

Konstruktor

NycTlcFhv(start_date: datetime = datetime.datetime(2015, 1, 1, 0, 0), end_date: datetime = datetime.datetime(2024, 12, 13, 0, 0), cols: List[str] | None = None, limit: int | None = -1, enable_telemetry: bool = True)

Parametry

Nazwa Opis
start_date

Data rozpoczęcia ładowania danych włącznie. Jeśli wartość None ( Brak), zostanie użyta default_start_date wartość .

Domyślna wartość: 2015-01-01 00:00:00
end_date

Data zakończenia ładowania danych włącznie. Jeśli wartość None ( Brak), zostanie użyta default_end_date wartość .

Domyślna wartość: 2024-12-13 00:00:00
cols

Lista nazw kolumn do załadowania z zestawu danych. Jeśli wartość Brak, wszystkie kolumny zostaną załadowane. Aby uzyskać informacje na temat dostępnych kolumn w tym zestawie danych, zobacz Rekordy podróży NYC Taxi & Limousine Commission - For-Hire Vehicle (FULLV).

Domyślna wartość: None
limit
int

Wartość wskazująca liczbę dni ładowania danych za pomocą to_pandas_dataframe()polecenia . Jeśli nie zostanie określony, wartość domyślna -1 oznacza brak limitu w dniach załadowanych.

Domyślna wartość: -1
enable_telemetry

Czy włączyć telemetrię dla tego zestawu danych.

Domyślna wartość: True
start_date
Wymagane

Data rozpoczęcia, dla której chcesz wykonywać zapytania włącznie.

end_date
Wymagane

Data zakończenia, dla której chcesz wykonywać zapytania włącznie.

cols
Wymagane

Lista nazw kolumn, które chcesz pobrać. Żadna z nich nie pobierze wszystkich kolumn.

limit
Wymagane
int

to_pandas_dataframe() będzie ładować tylko "limit" miesięcy danych. -1 oznacza brak limitu.

enable_telemetry
Wymagane

Wskazuje, czy wysyłać dane telemetryczne.

Uwagi

W poniższym przykładzie pokazano, jak uzyskać dostęp do zestawu danych.


   from azureml.opendatasets import NycTlcFhv
   from dateutil import parser

   end_date = parser.parse('2018-06-06')
   start_date = parser.parse('2018-05-01')
   nyc_tlc = NycTlcFhv(start_date=start_date, end_date=end_date)
   nyc_tlc_df = nyc_tlc.to_pandas_dataframe()