NycTlcGreen Klasa
Reprezentuje publiczny zestaw danych NYC Taxi & Limousine Commission green taxi trip.
Rekordy dotyczące przejazdów zielonymi taksówkami zawierają pola daty i godziny rozpoczęcia oraz zakończenia kursu, miejsca rozpoczęcia i zakończenia kursu, pokonanej odległości, wyszczególnionych opłat, taryfy, metody płatności oraz liczby pasażerów podanej przez kierowcę. Aby uzyskać więcej informacji na temat tego zestawu danych, w tym opisów kolumn, różnych sposobów uzyskiwania dostępu do zestawu danych i przykładów, zobacz NYC Taxi & Limousine Commission — zielone rekordy przejazdów taksówką w katalogu Microsoft Azure Open Datasets.
Aby zapoznać się z przykładem użycia klasy NycTlcGreen, zobacz samouczek Używanie zautomatyzowanego uczenia maszynowego do przewidywania opłat za taksówkę.
Inicjowanie pól filtrowania.
- Dziedziczenie
-
azureml.opendatasets._nyc_taxi_base.NycTaxiBaseNycTlcGreen
Konstruktor
NycTlcGreen(start_date: datetime = datetime.datetime(2015, 1, 1, 0, 0), end_date: datetime = datetime.datetime(2024, 12, 13, 0, 0), cols: List[str] | None = None, limit: int | None = -1, enable_telemetry: bool = True)
Parametry
Nazwa | Opis |
---|---|
start_date
|
Data rozpoczęcia ładowania danych włącznie. Jeśli wartość None ( Brak), zostanie użyta Domyślna wartość: 2015-01-01 00:00:00
|
end_date
|
Data zakończenia ładowania danych włącznie. Jeśli wartość None ( Brak), zostanie użyta Domyślna wartość: 2024-12-13 00:00:00
|
cols
|
Lista nazw kolumn do załadowania z zestawu danych. Jeśli wartość Brak, wszystkie kolumny zostaną załadowane. Aby uzyskać informacje na temat dostępnych kolumn w tym zestawie danych, zobacz NYC Taxi & Limousine Commission - green taxi trip records (Komisja NYC Taxi & Limousine — rekordy przejazdów zielonymi taksówkami). Domyślna wartość: None
|
limit
|
Wartość wskazująca liczbę dni ładowania danych za pomocą Domyślna wartość: -1
|
enable_telemetry
|
Czy włączyć telemetrię dla tego zestawu danych. Domyślna wartość: True
|
start_date
Wymagane
|
Data rozpoczęcia, dla której chcesz wykonywać zapytania włącznie. |
end_date
Wymagane
|
Data zakończenia, dla której chcesz wykonywać zapytania włącznie. |
cols
Wymagane
|
Lista nazw kolumn, które chcesz pobrać. Żadna z nich nie pobierze wszystkich kolumn. |
limit
Wymagane
|
to_pandas_dataframe() będzie ładować tylko "limit" miesięcy danych. -1 oznacza brak limitu. |
enable_telemetry
Wymagane
|
Wskazuje, czy wysyłać dane telemetryczne. |
Uwagi
W poniższym przykładzie pokazano, jak uzyskać dostęp do zestawu danych.
from azureml.opendatasets import NycTlcGreen
from dateutil import parser
end_date = parser.parse('2018-06-06')
start_date = parser.parse('2018-05-01')
nyc_tlc = NycTlcGreen(start_date=start_date, end_date=end_date)
nyc_tlc_df = nyc_tlc.to_pandas_dataframe()