NycTlcYellow 类
表示纽约市出租车 & 豪华轿车委员会黄色出租车行程公共数据集。
黄色的出租车行程记录包括捕获以下信息的字段:上车和下车日期/时间、上车和下车位置、行程距离、逐条记录的车费、费率类型、付款类型和司机报告的乘客数。 有关此数据集的详细信息,包括列说明、访问数据集的不同方式和示例,请参阅 Microsoft Azure 开放数据集目录中的 NYC 出租车 & 豪华轿车委员会 - 黄色出租车行程记录 。
初始化筛选字段。
- 继承
-
azureml.opendatasets._nyc_taxi_base.NycTaxiBaseNycTlcYellow
构造函数
NycTlcYellow(start_date: datetime = datetime.datetime(2015, 1, 1, 0, 0), end_date: datetime = datetime.datetime(2024, 12, 13, 0, 0), cols: List[str] | None = None, limit: int | None = -1, enable_telemetry: bool = True)
参数
名称 | 说明 |
---|---|
start_date
|
开始加载数据的日期(含)。 如果为“无”,则使用 默认值: 2015-01-01 00:00:00
|
end_date
|
结束加载数据的日期(含)。 如果为“无”,则使用 默认值: 2024-12-13 00:00:00
|
cols
|
要从数据集加载的列名称的列表。 如果为 None,则加载所有列。 有关此数据集中可用列的信息,请参阅 NYC 出租车 & 豪华轿车委员会 - 黄色出租车行程记录。 默认值: None
|
limit
|
一个值,该值指示要加载 默认值: -1
|
enable_telemetry
|
是否对此数据集启用遥测。 默认值: True
|
start_date
必需
|
要查询的开始日期(含)。 |
end_date
必需
|
要查询的结束日期(含)。 |
cols
必需
|
要检索的列名称的列表。 “无”将获取所有列。 |
limit
必需
|
to_pandas_dataframe () 将仅加载“限制”月的数据。 -1 表示没有限制。 |
enable_telemetry
必需
|
指示是否发送遥测数据。 |
注解
下面的示例演示如何访问数据集。
from azureml.opendatasets import NycTlcYellow
from dateutil import parser
end_date = parser.parse('2018-06-06')
start_date = parser.parse('2018-05-01')
nyc_tlc = NycTlcYellow(start_date=start_date, end_date=end_date)
nyc_tlc_df = nyc_tlc.to_pandas_dataframe()