Condividi tramite


NycTlcGreen Classe

Rappresenta il set di dati pubblico del taxi di Nyc Taxi & Limousine Commission.

I record relativi alle corse dei taxi verdi includono campi contenenti data e ora di partenza e di arrivo, luogo di partenza e di arrivo, distanze delle corse, dettaglio delle tariffe, tipi di tariffa, tipi di pagamento e numero di passeggeri segnalato dal tassista. Per altre informazioni su questo set di dati, incluse le descrizioni delle colonne, diversi modi per accedere al set di dati e esempi, vedere Nyc Taxi & Limousine Commission - record di viaggio in taxi verdi nel catalogo Set di dati aperti di Microsoft Azure.

Per un esempio di uso della classe NycTlcGreen, vedere l'esercitazione Usare Machine Learning automatizzato per stimare le tariffe dei taxi.

Inizializzare i campi di filtro.

Ereditarietà
azureml.opendatasets._nyc_taxi_base.NycTaxiBase
NycTlcGreen

Costruttore

NycTlcGreen(start_date: datetime = datetime.datetime(2015, 1, 1, 0, 0), end_date: datetime = datetime.datetime(2024, 12, 13, 0, 0), cols: List[str] | None = None, limit: int | None = -1, enable_telemetry: bool = True)

Parametri

Nome Descrizione
start_date

Data in cui avviare il caricamento dei dati, inclusiva. Se None, viene usato l'oggetto default_start_date .

Valore predefinito: 2015-01-01 00:00:00
end_date

Data in cui terminare il caricamento dei dati, inclusiva. Se None, viene usato l'oggetto default_end_date .

Valore predefinito: 2024-12-13 00:00:00
cols

Elenco di nomi di colonne da caricare dal set di dati. Se None, tutte le colonne vengono caricate. Per informazioni sulle colonne disponibili in questo set di dati, vedere Nyc Taxi & Limousine Commission - record di taxi verdi.

Valore predefinito: None
limit
int

Valore che indica il numero di giorni di dati da caricare con to_pandas_dataframe(). Se non specificato, l'impostazione predefinita di -1 indica che non è previsto alcun limite nei giorni caricati.

Valore predefinito: -1
enable_telemetry

Se abilitare i dati di telemetria in questo set di dati.

Valore predefinito: True
start_date
Necessario

Data di inizio che si desidera eseguire query in modo inclusivo.

end_date
Necessario

Data di fine che si desidera eseguire query in modo inclusivo.

cols
Necessario

Elenco dei nomi di colonna da recuperare. Nessuno otterrà tutte le colonne.

limit
Necessario
int

to_pandas_dataframe() caricherà solo i mesi "limite" dei dati. -1 indica che non è presente alcun limite.

enable_telemetry
Necessario

Indica se inviare dati di telemetria.

Commenti

Nell'esempio seguente viene illustrato come accedere al set di dati.


   from azureml.opendatasets import NycTlcGreen
   from dateutil import parser

   end_date = parser.parse('2018-06-06')
   start_date = parser.parse('2018-05-01')
   nyc_tlc = NycTlcGreen(start_date=start_date, end_date=end_date)
   nyc_tlc_df = nyc_tlc.to_pandas_dataframe()