Partager via


NycTlcGreen Classe

Représente le jeu de données public nyC Taxi & Limousine Commission.

Les enregistrements de trajets en taxi vert incluent des champs indiquant les dates et heures de début et fin de trajet, les lieux de départ et d’arrivée, la distance des trajets, les tarifs détaillés, les types de tarifs, les types de paiement et le nombre de passagers signalé par le conducteur. Pour plus d’informations sur ce jeu de données, y compris les descriptions de colonnes, les différentes façons d’accéder au jeu de données et des exemples, consultez NYC Taxi & Limousine Commission - Green Taxi Trip Records dans le catalogue Microsoft Azure Open Datasets.

Pour obtenir un exemple d’utilisation de la classe NycTlcGreen, consultez le tutoriel Utiliser le Machine Learning automatisé pour prédire le prix des courses de taxi.

Initialisez les champs de filtrage.

Héritage
azureml.opendatasets._nyc_taxi_base.NycTaxiBase
NycTlcGreen

Constructeur

NycTlcGreen(start_date: datetime = datetime.datetime(2015, 1, 1, 0, 0), end_date: datetime = datetime.datetime(2024, 10, 18, 0, 0), cols: List[str] | None = None, limit: int | None = -1, enable_telemetry: bool = True)

Paramètres

Nom Description
start_date

Date de début (incluse) du chargement des données. Si None est spécifié, default_start_date est utilisé.

Valeur par défaut: 2015-01-01 00:00:00
end_date

Date de fin (incluse) du chargement des données. Si None est spécifié, default_end_date est utilisé.

Valeur par défaut: 2024-10-18 00:00:00
cols

Liste des noms de colonnes à charger à partir du jeu de données. Si None est spécifié, toutes les colonnes sont chargées. Pour plus d’informations sur les colonnes disponibles dans ce jeu de données, consultez NyC Taxi & Limousine Commission - Green Taxi Trip Records.

Valeur par défaut: None
limit
int

Valeur indiquant le nombre de jours de données à charger avec to_pandas_dataframe(). En l’absence d’indication, la valeur par défaut -1 signifie qu’il n’existe aucune limite au nombre de jours à charger.

Valeur par défaut: -1
enable_telemetry

Indique s’il est nécessaire d’activer la télémétrie pour ce jeu de données.

Valeur par défaut: True
start_date
Obligatoire

Date de début que vous souhaitez interroger de manière inclusive.

end_date
Obligatoire

Date de fin que vous souhaitez interroger de manière inclusive.

cols
Obligatoire

Liste des noms de colonnes que vous souhaitez récupérer. La valeur None permet d’obtenir toutes les colonnes.

limit
Obligatoire
int

to_pandas_dataframe() ne charge que « limite » les mois de données. -1 signifie illimité.

enable_telemetry
Obligatoire

Indique s’il est nécessaire d’envoyer des données de télémétrie.

Remarques

L’exemple ci-dessous montre comment accéder au jeu de données.


   from azureml.opendatasets import NycTlcGreen
   from dateutil import parser

   end_date = parser.parse('2018-06-06')
   start_date = parser.parse('2018-05-01')
   nyc_tlc = NycTlcGreen(start_date=start_date, end_date=end_date)
   nyc_tlc_df = nyc_tlc.to_pandas_dataframe()