Udostępnij za pośrednictwem


NycTlcYellow Klasa

Reprezentuje zestaw danych publicznych NYC Taxi & Limousine Commission żółty zestaw danych przejazdu taksówką.

Rekordy dotyczące przejazdów żółtymi taksówkami zawierają pola daty i godziny rozpoczęcia oraz zakończenia kursu, miejsca rozpoczęcia i zakończenia kursu, pokonanej odległości, wyszczególnionych opłat, taryfy, metody płatności oraz liczby pasażerów podanej przez kierowcę. Aby uzyskać więcej informacji na temat tego zestawu danych, w tym opisów kolumn, różnych sposobów uzyskiwania dostępu do zestawu danych i przykładów, zobacz NYC Taxi & Limousine Commission — żółte rekordy przejazdów taksówką w katalogu Microsoft Azure Open Datasets.

Inicjowanie pól filtrowania.

Dziedziczenie
azureml.opendatasets._nyc_taxi_base.NycTaxiBase
NycTlcYellow

Konstruktor

NycTlcYellow(start_date: datetime = datetime.datetime(2015, 1, 1, 0, 0), end_date: datetime = datetime.datetime(2024, 12, 13, 0, 0), cols: List[str] | None = None, limit: int | None = -1, enable_telemetry: bool = True)

Parametry

Nazwa Opis
start_date

Data rozpoczęcia ładowania danych włącznie. Jeśli wartość Brak, zostanie użyta default_start_date .

Domyślna wartość: 2015-01-01 00:00:00
end_date

Data zakończenia ładowania danych, włącznie z tą datą. Jeśli wartość Brak, zostanie użyta default_end_date .

Domyślna wartość: 2024-12-13 00:00:00
cols

Lista nazw kolumn do załadowania z zestawu danych. Jeśli brak, wszystkie kolumny zostaną załadowane. Aby uzyskać informacje na temat dostępnych kolumn w tym zestawie danych, zobacz NYC Taxi & Limousine Commission - żółte rekordy przejazdów taksówką.

Domyślna wartość: None
limit
int

Wartość wskazująca liczbę dni ładowania danych za pomocą polecenia to_pandas_dataframe(). Jeśli nie zostanie określony, wartość domyślna -1 oznacza brak limitu w dniach załadowanych.

Domyślna wartość: -1
enable_telemetry

Czy włączyć telemetrię dla tego zestawu danych.

Domyślna wartość: True
start_date
Wymagane

Data rozpoczęcia, o którą chcesz wykonać zapytanie włącznie.

end_date
Wymagane

Data zakończenia, która ma być wysyłana do zapytania włącznie.

cols
Wymagane

Lista nazw kolumn, które chcesz pobrać. Żadna z nich nie uzyska wszystkich kolumn.

limit
Wymagane
int

to_pandas_dataframe() będzie ładować tylko "limit" miesięcy danych. -1 oznacza brak limitu.

enable_telemetry
Wymagane

Wskazuje, czy wysyłać dane telemetryczne.

Uwagi

W poniższym przykładzie pokazano, jak uzyskać dostęp do zestawu danych.


   from azureml.opendatasets import NycTlcYellow
   from dateutil import parser

   end_date = parser.parse('2018-06-06')
   start_date = parser.parse('2018-05-01')
   nyc_tlc = NycTlcYellow(start_date=start_date, end_date=end_date)
   nyc_tlc_df = nyc_tlc.to_pandas_dataframe()