NycTlcGreen Klasse
Represents the NYC Taxi & Limousine Commission green taxi trip public dataset.
Datensätze zu Fahrten mit grünen Taxis enthalten Felder mit Datum/Uhrzeit für Abholung und Ankunft, Start- und Zielort, zurückgelegten Entfernungen, Einzelkosten, Tarifarten, Zahlungsarten und vom Fahrer gemeldeten Fahrgastzahlen. Weitere Informationen zu diesem Dataset, einschließlich Spaltenbeschreibungen, verschiedenen Zugriffsmöglichkeiten auf das Dataset und Beispiele, finden Sie unter NYC Taxi & Limousine Commission – Green Taxi Trip Records im Microsoft Azure Open Datasets-Katalog.
Ein Beispiel für die Verwendung der NycTlcGreen-Klasse finden Sie im Tutorial Vorhersagen von Preisen für Taxifahrten mit automatisiertem maschinellem Lernen.
Initialisieren sie Filterfelder.
- Vererbung
-
azureml.opendatasets._nyc_taxi_base.NycTaxiBaseNycTlcGreen
Konstruktor
NycTlcGreen(start_date: datetime = datetime.datetime(2015, 1, 1, 0, 0), end_date: datetime = datetime.datetime(2024, 12, 13, 0, 0), cols: List[str] | None = None, limit: int | None = -1, enable_telemetry: bool = True)
Parameter
Name | Beschreibung |
---|---|
start_date
|
Das Datum, an dem mit dem Laden von Daten begonnen werden soll (einschließlich). Bei „None“ wird das Standardwert: 2015-01-01 00:00:00
|
end_date
|
Das Datum, an dem das Laden von Daten beendet werden soll (einschließlich). Bei „None“ wird das Standardwert: 2024-12-13 00:00:00
|
cols
|
Eine Liste der Spaltennamen, die aus dem Dataset geladen werden sollen. Wenn „None“ angezeigt wird, werden alle Spalten geladen. Informationen zu den verfügbaren Spalten in diesem Dataset finden Sie unter NYC Taxi & Limousine Commission – Green Taxi Trip Records. Standardwert: None
|
limit
|
Ein Wert, der die Anzahl von Tagen angibt, für die Daten mit Standardwert: -1
|
enable_telemetry
|
Gibt an, ob Telemetriedaten für dieses Dataset aktiviert werden sollen Standardwert: True
|
start_date
Erforderlich
|
Das Startdatum, das Sie inklusiv abfragen möchten. |
end_date
Erforderlich
|
Das Enddatum, das Sie inklusive abfragen möchten. |
cols
Erforderlich
|
Eine Liste der Spaltennamen, die Sie abrufen möchten. Mit None werden alle Spalten abgerufen. |
limit
Erforderlich
|
to_pandas_dataframe() lädt nur "limit" Monate an Daten. Der Wert "-1" bedeutet, dass es keine Begrenzung gibt. |
enable_telemetry
Erforderlich
|
Gibt an, ob Telemetriedaten gesendet werden sollen. |
Hinweise
Im Beispiel unten wird gezeigt, wie auf dieses Dataset zugegriffen werden kann.
from azureml.opendatasets import NycTlcGreen
from dateutil import parser
end_date = parser.parse('2018-06-06')
start_date = parser.parse('2018-05-01')
nyc_tlc = NycTlcGreen(start_date=start_date, end_date=end_date)
nyc_tlc_df = nyc_tlc.to_pandas_dataframe()