NycTlcFhv 类

表示纽约市出租车 & 豪华轿车委员会公共数据集。

该数据集包含营运车辆 (FHV) 的行程记录,其中包括捕获调度基地许可证号、搭车日期、时间和出租车区域位置 ID 的字段(形成的文件如下)。 这些记录由基地所提交的 FHV 行程记录生成。 有关此数据集的详细信息,包括列说明、访问数据集的不同方式和示例,请参阅 Microsoft Azure 开放数据集目录中的 NYC 出租车 & 豪华轿车委员会 - For-Hire 车辆 (FHV) 行程记录

初始化筛选字段。

继承
azureml.opendatasets._nyc_taxi_base.NycTaxiBase
NycTlcFhv

构造函数

NycTlcFhv(start_date: datetime = datetime.datetime(2015, 1, 1, 0, 0), end_date: datetime = datetime.datetime(2024, 12, 13, 0, 0), cols: List[str] | None = None, limit: int | None = -1, enable_telemetry: bool = True)

参数

名称 说明
start_date

开始加载数据的日期(含)。 如果为“无”,则使用 default_start_date

默认值: 2015-01-01 00:00:00
end_date

结束加载数据的日期(含)。 如果为“无”,则使用 default_end_date

默认值: 2024-12-13 00:00:00
cols

要从数据集加载的列名称的列表。 如果为 None,则加载所有列。 有关此数据集中可用列的信息,请参阅 NYC 出租车 & 豪华轿车委员会 - For-Hire 车辆 (FHV) 行程记录

默认值: None
limit
int

一个值,该值指示要加载 to_pandas_dataframe() 的数据的天数。 如果未指定,则默认值为 -1,表示不限制加载的天数。

默认值: -1
enable_telemetry

是否对此数据集启用遥测。

默认值: True
start_date
必需

要查询的开始日期(含)。

end_date
必需

要查询的结束日期(含)。

cols
必需

要检索的列名列表。 “无”将获取所有列。

limit
必需
int

to_pandas_dataframe () 将仅加载“限制”月份的数据。 -1 表示没有限制。

enable_telemetry
必需

指示是否发送遥测数据。

注解

下面的示例演示如何访问数据集。


   from azureml.opendatasets import NycTlcFhv
   from dateutil import parser

   end_date = parser.parse('2018-06-06')
   start_date = parser.parse('2018-05-01')
   nyc_tlc = NycTlcFhv(start_date=start_date, end_date=end_date)
   nyc_tlc_df = nyc_tlc.to_pandas_dataframe()