Power Query SDK 测试框架第 2 部分 - 测试数据
此参考包含多个部分,介绍适用于 Power Query 连接器开发人员的标准测试套件的设置和运行。 应按顺序执行参考,以确保将环境设置用于测试扩展连接器。
本部分的操作:
- 了解测试的标准套件中使用的数据集
- 下载测试数据的副本
- 将数据上传到要测试的连接器的数据库选择
本部分介绍供测试套件验证连接器的测试数据。
数据集概述
该框架使用的测试数据是纽约市出租车和豪华轿车委员会 (TLC) 绿色出行记录数据的修改版本。
2023 年 2 月的绿色出行数据被转换为“NycTaxiGreen”CSV 文件,并从中采样了 10,000 行。 同样,“TaxiZoneLookup”CSV 文件包含出租车区域查找表中的 265 行。 选择 CSV 数据格式是因为它对几乎所有其他数据源都有广泛的适用性,因此更容易导入。
每个字段的定义可能与 NYC 出租车和豪华轿车绿色数据集 - Azure 开放数据集和 data_dictionary_trip_records_green.pdf (nyc.gov) 中找到的信息略有不同。
测试的数据集拆分为两个 csv 文件:NycTaxiGreen 和 TaxiZoneLookup。
获取测试数据
测试数据放置在数据连接器 git 存储库中。 测试数据以 CSV 的形式提供,并提供 NycTaxiGreen 和 TaxiZoneLookup 表的架构定义。 该数据应作为单独的表加载到数据源,并且需要确保架构与数据源中定义的数据类型相对应。
注意
上传到数据源时,所有小数值的小数位数均应为 2。 也就是说,小数点后面应为 2 位数。
所有时间戳值都应以 MM/DD/YYYY HH24:MI:SS
格式上传到数据源。
还可以查看有关测试数据的详细信息。
资源:
NycTaxiGreen 表说明
下表提供了有关“NycTaxiGreen”表中每个字段的更多信息:
名称 | Type | 描述 |
---|---|---|
RecordID | Integer | 原始记录 ID 顺序。 由于是随机采样,因此 CSV 的开头是无序的。 此字段可用作表的主键。 |
VendorID | Integer | 指示提供程序的代码。 |
lpep_pickup_datetime | 时间戳 | 不包括时区信息。 如果数据源需要,则应使用 UTC。 |
Lpep_dropoff_datetime | 时间戳 | 不包括时区信息。 如果数据源需要,则应使用 UTC。 |
store_and_fwd_flag | 布尔 | true/false 字段。 如果未指定字段类型,某些数据源可能会将此字段导入为字符或字符串。 出于测试目的,应将该字段指定为布尔值。 |
RatecodeID | Integer | 行程结束时实行的费率代码。 |
PULocationID | Integer | 使用出租车计价器的 TLC 出租车区域。 |
DOLocationID | Integer | 未使用出租车计价器的 TLC 出租车区域。 |
passenger_count | Integer | 车辆中的乘客人数。 |
trip_distance | 双精度 | 经过的行程距离(以英里为单位)。 |
fare_amount | 双精度 | 按时间和距离计算的车费。 2 位小数。 |
extra | 双精度 | 其他费用。 2 位小数。 |
mta_tax | 双精度 | 含 MTA 税。 2 位小数。 |
tip_amount | 双精度 | 小费金额。 2 位小数。 |
tolls_amount | 双精度 | 行程中支付的通行费总数。 2 位小数。 |
improvement_surcharge | 双精度 | 改善附加费。 2 位小数。 |
total_amount | 双精度 | 向客户收取的总价格。 不含小费。 2 位小数。 |
payment_type | Integer | 表示乘客支付方式的数字代码。 |
trip_type | Integer | 表示出租车是招停还是调派的数字代码。 |
congestion_surcharge | 双精度 | 额外的拥堵费。 2 位小数。 |
TaxiZoneLookup 表说明
下表提供了有关“TaxiZoneLookup”表中每个字段的更多信息:
名称 | Type | 描述 |
---|---|---|
LocationId | Integer | 任何位置的位置 ID。 它映射到“NycTaxiGreen”表中的 PULocationID 和 DOLocationID。 此字段可用作表的主键。 |
行政区 | 字符串 | 位置所在的行政区。 |
区域 | 字符串 | 位置所在区域的名称。 |
service_zone | 字符串 | 位置所在服务区域的名称。 |
结束语
本节介绍了标准化测试套件中使用的测试数据及其架构。 数据库现在应该填充基于具有正确架构的指定 CSV 文件的表。
在下一部分中,你将了解测试套件的不同部分,这有助于验证数据集和扩展连接器的设置。