NycTlcGreen Classe
Rappresenta il set di dati pubblico del taxi di Nyc Taxi & Limousine Commission.
I record relativi alle corse dei taxi verdi includono campi contenenti data e ora di partenza e di arrivo, luogo di partenza e di arrivo, distanze delle corse, dettaglio delle tariffe, tipi di tariffa, tipi di pagamento e numero di passeggeri segnalato dal tassista. Per altre informazioni su questo set di dati, incluse le descrizioni delle colonne, diversi modi per accedere al set di dati e esempi, vedere Nyc Taxi & Limousine Commission - record di viaggio in taxi verdi nel catalogo Set di dati aperti di Microsoft Azure.
Per un esempio di uso della classe NycTlcGreen, vedere l'esercitazione Usare Machine Learning automatizzato per stimare le tariffe dei taxi.
Inizializzare i campi di filtro.
- Ereditarietà
-
azureml.opendatasets._nyc_taxi_base.NycTaxiBaseNycTlcGreen
Costruttore
NycTlcGreen(start_date: datetime = datetime.datetime(2015, 1, 1, 0, 0), end_date: datetime = datetime.datetime(2024, 12, 13, 0, 0), cols: List[str] | None = None, limit: int | None = -1, enable_telemetry: bool = True)
Parametri
Nome | Descrizione |
---|---|
start_date
|
Data in cui avviare il caricamento dei dati, inclusiva. Se None, viene usato l'oggetto Valore predefinito: 2015-01-01 00:00:00
|
end_date
|
Data in cui terminare il caricamento dei dati, inclusiva. Se None, viene usato l'oggetto Valore predefinito: 2024-12-13 00:00:00
|
cols
|
Elenco di nomi di colonne da caricare dal set di dati. Se None, tutte le colonne vengono caricate. Per informazioni sulle colonne disponibili in questo set di dati, vedere Nyc Taxi & Limousine Commission - record di taxi verdi. Valore predefinito: None
|
limit
|
Valore che indica il numero di giorni di dati da caricare con Valore predefinito: -1
|
enable_telemetry
|
Se abilitare i dati di telemetria in questo set di dati. Valore predefinito: True
|
start_date
Necessario
|
Data di inizio che si desidera eseguire query in modo inclusivo. |
end_date
Necessario
|
Data di fine che si desidera eseguire query in modo inclusivo. |
cols
Necessario
|
Elenco dei nomi di colonna da recuperare. Nessuno otterrà tutte le colonne. |
limit
Necessario
|
to_pandas_dataframe() caricherà solo i mesi "limite" dei dati. -1 indica che non è presente alcun limite. |
enable_telemetry
Necessario
|
Indica se inviare dati di telemetria. |
Commenti
Nell'esempio seguente viene illustrato come accedere al set di dati.
from azureml.opendatasets import NycTlcGreen
from dateutil import parser
end_date = parser.parse('2018-06-06')
start_date = parser.parse('2018-05-01')
nyc_tlc = NycTlcGreen(start_date=start_date, end_date=end_date)
nyc_tlc_df = nyc_tlc.to_pandas_dataframe()