Compartir a través de


NycTlcGreen Clase

Representa el conjunto de datos público nyc taxi & Limousine Commission.

Los registros de carreras de taxis verdes incluyen campos que recopilan la fecha, la hora y el lugar donde se recoge y se deja a los pasajeros, las distancias de las carreras, las tarifas desglosadas, los tipos de tarifa, los tipos de pago y los recuentos de pasajeros notificados por el conductor. Para obtener más información sobre este conjunto de datos, incluidas las descripciones de columnas, distintas formas de acceder al conjunto de datos y ejemplos, consulte NYC Taxi & Limousine Commission - green taxi trip records (Registros de carreras de taxis verdes) en el catálogo microsoft Azure Open Datasets.

Para obtener un ejemplo del uso de la clase NycTlcGreen, consulte el tutorial Uso del aprendizaje automático automatizado para predecir tarifas de taxi.

Inicialice los campos de filtrado.

Herencia
azureml.opendatasets._nyc_taxi_base.NycTaxiBase
NycTlcGreen

Constructor

NycTlcGreen(start_date: datetime = datetime.datetime(2015, 1, 1, 0, 0), end_date: datetime = datetime.datetime(2024, 10, 18, 0, 0), cols: List[str] | None = None, limit: int | None = -1, enable_telemetry: bool = True)

Parámetros

Nombre Description
start_date

Fecha en la que se inicia la carga de datos, inclusive. Si es None, se usa default_start_date.

Valor predeterminado: 2015-01-01 00:00:00
end_date

Fecha en la que se finaliza la carga de datos, inclusive. Si es None, se usa default_end_date.

Valor predeterminado: 2024-10-18 00:00:00
cols

Lista de nombres de columnas que se cargarán desde el conjunto de datos. Si es None, se cargan todas las columnas. Para obtener información sobre las columnas disponibles de este conjunto de datos, consulte Nyc Taxi & Limousine Commission - green taxi trip records.

Valor predeterminado: None
limit
int

Valor que indica el número de días de datos que se cargarán con to_pandas_dataframe(). Si no se especifica, el valor predeterminado de -1 significa que no hay límite en los días cargados.

Valor predeterminado: -1
enable_telemetry

Si se va a habilitar la telemetría en este conjunto de datos.

Valor predeterminado: True
start_date
Requerido

La fecha de inicio que desea consultar de forma inclusiva.

end_date
Requerido

La fecha de finalización que desea consultar de forma inclusiva.

cols
Requerido

Lista de nombres de columna que desea recuperar. El valor None obtendrá todas las columnas.

limit
Requerido
int

to_pandas_dataframe() cargará solo los meses de "límite" de los datos. -1 significa sin límite.

enable_telemetry
Requerido

Indica si se va a enviar telemetría.

Comentarios

El ejemplo siguiente muestra cómo acceder al conjunto de datos.


   from azureml.opendatasets import NycTlcGreen
   from dateutil import parser

   end_date = parser.parse('2018-06-06')
   start_date = parser.parse('2018-05-01')
   nyc_tlc = NycTlcGreen(start_date=start_date, end_date=end_date)
   nyc_tlc_df = nyc_tlc.to_pandas_dataframe()