NycTlcYellow Classe
Représente le jeu de données public nyC Taxi & Limousine Commission yellow taxi trip.
Les enregistrements de trajets en taxi jaune incluent des champs indiquant les dates et heures de début et fin de trajet, les lieux de départ et d’arrivée, la distance des trajets, les tarifs détaillés, les types de tarifs, les types de paiement et le nombre de passagers signalé par le conducteur. Pour plus d’informations sur ce jeu de données, notamment des descriptions de colonnes, les différentes façons d’accéder au jeu de données et des exemples, consultez NyC Taxi & Limousine Commission - yellow taxi trip records dans le catalogue Microsoft Azure Open Datasets.
Initialisez les champs de filtrage.
- Héritage
-
azureml.opendatasets._nyc_taxi_base.NycTaxiBaseNycTlcYellow
Constructeur
NycTlcYellow(start_date: datetime = datetime.datetime(2015, 1, 1, 0, 0), end_date: datetime = datetime.datetime(2024, 10, 18, 0, 0), cols: List[str] | None = None, limit: int | None = -1, enable_telemetry: bool = True)
Paramètres
Nom | Description |
---|---|
start_date
|
Date de début (incluse) du chargement des données. Si None est spécifié, Valeur par défaut: 2015-01-01 00:00:00
|
end_date
|
Date de fin (incluse) du chargement des données. Si None est spécifié, Valeur par défaut: 2024-10-18 00:00:00
|
cols
|
Liste des noms de colonnes à charger à partir du jeu de données. Si None est spécifié, toutes les colonnes sont chargées. Pour plus d’informations sur les colonnes disponibles dans ce jeu de données, consultez NyC Taxi & Limousine Commission - yellow taxi trip records. Valeur par défaut: None
|
limit
|
Valeur indiquant le nombre de jours de données à charger avec Valeur par défaut: -1
|
enable_telemetry
|
Indique s’il est nécessaire d’activer la télémétrie pour ce jeu de données. Valeur par défaut: True
|
start_date
Obligatoire
|
Date de début que vous souhaitez interroger de manière inclusive. |
end_date
Obligatoire
|
Date de fin que vous souhaitez interroger de manière inclusive. |
cols
Obligatoire
|
Liste des noms de colonnes que vous souhaitez récupérer. La valeur None permet d’obtenir toutes les colonnes. |
limit
Obligatoire
|
to_pandas_dataframe() ne charge que « limite » les mois de données. -1 signifie illimité. |
enable_telemetry
Obligatoire
|
Indique s’il est nécessaire d’envoyer des données de télémétrie. |
Remarques
L’exemple ci-dessous montre comment accéder au jeu de données.
from azureml.opendatasets import NycTlcYellow
from dateutil import parser
end_date = parser.parse('2018-06-06')
start_date = parser.parse('2018-05-01')
nyc_tlc = NycTlcYellow(start_date=start_date, end_date=end_date)
nyc_tlc_df = nyc_tlc.to_pandas_dataframe()