Udostępnij za pośrednictwem


NycTlcGreen Klasa

Reprezentuje publiczny zestaw danych NYC Taxi & Limousine Commission green taxi trip.

Rekordy dotyczące przejazdów zielonymi taksówkami zawierają pola daty i godziny rozpoczęcia oraz zakończenia kursu, miejsca rozpoczęcia i zakończenia kursu, pokonanej odległości, wyszczególnionych opłat, taryfy, metody płatności oraz liczby pasażerów podanej przez kierowcę. Aby uzyskać więcej informacji na temat tego zestawu danych, w tym opisów kolumn, różnych sposobów uzyskiwania dostępu do zestawu danych i przykładów, zobacz NYC Taxi & Limousine Commission — zielone rekordy przejazdów taksówką w katalogu Microsoft Azure Open Datasets.

Aby zapoznać się z przykładem użycia klasy NycTlcGreen, zobacz samouczek Używanie zautomatyzowanego uczenia maszynowego do przewidywania opłat za taksówkę.

Inicjowanie pól filtrowania.

Dziedziczenie
azureml.opendatasets._nyc_taxi_base.NycTaxiBase
NycTlcGreen

Konstruktor

NycTlcGreen(start_date: datetime = datetime.datetime(2015, 1, 1, 0, 0), end_date: datetime = datetime.datetime(2024, 12, 13, 0, 0), cols: List[str] | None = None, limit: int | None = -1, enable_telemetry: bool = True)

Parametry

Nazwa Opis
start_date

Data rozpoczęcia ładowania danych włącznie. Jeśli wartość None ( Brak), zostanie użyta default_start_date wartość .

Domyślna wartość: 2015-01-01 00:00:00
end_date

Data zakończenia ładowania danych włącznie. Jeśli wartość None ( Brak), zostanie użyta default_end_date wartość .

Domyślna wartość: 2024-12-13 00:00:00
cols

Lista nazw kolumn do załadowania z zestawu danych. Jeśli wartość Brak, wszystkie kolumny zostaną załadowane. Aby uzyskać informacje na temat dostępnych kolumn w tym zestawie danych, zobacz NYC Taxi & Limousine Commission - green taxi trip records (Komisja NYC Taxi & Limousine — rekordy przejazdów zielonymi taksówkami).

Domyślna wartość: None
limit
int

Wartość wskazująca liczbę dni ładowania danych za pomocą to_pandas_dataframe()polecenia . Jeśli nie zostanie określony, wartość domyślna -1 oznacza brak limitu w dniach załadowanych.

Domyślna wartość: -1
enable_telemetry

Czy włączyć telemetrię dla tego zestawu danych.

Domyślna wartość: True
start_date
Wymagane

Data rozpoczęcia, dla której chcesz wykonywać zapytania włącznie.

end_date
Wymagane

Data zakończenia, dla której chcesz wykonywać zapytania włącznie.

cols
Wymagane

Lista nazw kolumn, które chcesz pobrać. Żadna z nich nie pobierze wszystkich kolumn.

limit
Wymagane
int

to_pandas_dataframe() będzie ładować tylko "limit" miesięcy danych. -1 oznacza brak limitu.

enable_telemetry
Wymagane

Wskazuje, czy wysyłać dane telemetryczne.

Uwagi

W poniższym przykładzie pokazano, jak uzyskać dostęp do zestawu danych.


   from azureml.opendatasets import NycTlcGreen
   from dateutil import parser

   end_date = parser.parse('2018-06-06')
   start_date = parser.parse('2018-05-01')
   nyc_tlc = NycTlcGreen(start_date=start_date, end_date=end_date)
   nyc_tlc_df = nyc_tlc.to_pandas_dataframe()