NycTlcYellow Klasse
Represents the NYC Taxi & Limousine Commission yellow taxi trip public dataset.
Datensätze zu Fahrten mit gelben Taxis enthalten Felder mit Datum/Uhrzeit für Abholung und Ankunft, Start- und Zielort, Fahrtentfernungen, Einzelkosten, Tarifarten, Zahlungsarten und vom Fahrer gemeldeten Fahrgastzahlen. Weitere Informationen zu diesem Dataset, einschließlich Spaltenbeschreibungen, verschiedenen Zugriffsmöglichkeiten auf das Dataset und Beispiele, finden Sie unter NYC Taxi & Limousine Commission – gelbe Taxifahrtendatensätze im Microsoft Azure Open Datasets-Katalog.
Initialisieren sie Filterfelder.
- Vererbung
-
azureml.opendatasets._nyc_taxi_base.NycTaxiBaseNycTlcYellow
Konstruktor
NycTlcYellow(start_date: datetime = datetime.datetime(2015, 1, 1, 0, 0), end_date: datetime = datetime.datetime(2024, 12, 13, 0, 0), cols: List[str] | None = None, limit: int | None = -1, enable_telemetry: bool = True)
Parameter
Name | Beschreibung |
---|---|
start_date
|
Das Datum, an dem mit dem Laden von Daten begonnen werden soll (einschließlich). Bei „None“ wird das Standardwert: 2015-01-01 00:00:00
|
end_date
|
Das Datum, an dem das Laden von Daten beendet werden soll (einschließlich). Bei „None“ wird das Standardwert: 2024-12-13 00:00:00
|
cols
|
Eine Liste der Spaltennamen, die aus dem Dataset geladen werden sollen. Wenn „None“ angezeigt wird, werden alle Spalten geladen. Informationen zu den verfügbaren Spalten in diesem Dataset finden Sie unter NYC Taxi & Limousine Commission – gelbe Taxifahrtendatensätze. Standardwert: None
|
limit
|
Ein Wert, der die Anzahl von Tagen angibt, für die Daten mit Standardwert: -1
|
enable_telemetry
|
Gibt an, ob Telemetriedaten für dieses Dataset aktiviert werden sollen Standardwert: True
|
start_date
Erforderlich
|
Das Startdatum, das Sie inklusiv abfragen möchten. |
end_date
Erforderlich
|
Das Enddatum, das Sie inklusive abfragen möchten. |
cols
Erforderlich
|
Eine Liste der Spaltennamen, die Sie abrufen möchten. Mit None werden alle Spalten abgerufen. |
limit
Erforderlich
|
to_pandas_dataframe() lädt nur "limit" Monate an Daten. Der Wert "-1" bedeutet, dass es keine Begrenzung gibt. |
enable_telemetry
Erforderlich
|
Gibt an, ob Telemetriedaten gesendet werden sollen. |
Hinweise
Im Beispiel unten wird gezeigt, wie auf dieses Dataset zugegriffen werden kann.
from azureml.opendatasets import NycTlcYellow
from dateutil import parser
end_date = parser.parse('2018-06-06')
start_date = parser.parse('2018-05-01')
nyc_tlc = NycTlcYellow(start_date=start_date, end_date=end_date)
nyc_tlc_df = nyc_tlc.to_pandas_dataframe()