Power Query SDK 测试框架第 2 部分 - 测试数据

此参考包含多个部分,介绍适用于 Power Query 连接器开发人员的标准测试套件的设置和运行。 应按顺序执行参考,以确保将环境设置用于测试扩展连接器。

本部分的操作:

  • 了解测试的标准套件中使用的数据集
  • 下载测试数据的副本
  • 将数据上传到要测试的连接器的数据库选择

本部分介绍供测试套件验证连接器的测试数据。

数据集概述

该框架使用的测试数据是纽约市出租车和豪华轿车委员会 (TLC) 绿色出行记录数据的修改版本。

2023 年 2 月的绿色出行数据被转换为“NycTaxiGreen”CSV 文件,并从中采样了 10,000 行。 同样,“TaxiZoneLookup”CSV 文件包含出租车区域查找表中的 265 行。 选择 CSV 数据格式是因为它对几乎所有其他数据源都有广泛的适用性,因此更容易导入。

每个字段的定义可能与 NYC 出租车和豪华轿车绿色数据集 - Azure 开放数据集data_dictionary_trip_records_green.pdf (nyc.gov) 中找到的信息略有不同。

测试的数据集拆分为两个 csv 文件:NycTaxiGreenTaxiZoneLookup

获取测试数据

测试数据放置在数据连接器 git 存储库中。 测试数据以 CSV 的形式提供,并提供 NycTaxiGreenTaxiZoneLookup 表的架构定义。 该数据应作为单独的表加载到数据源,并且需要确保架构与数据源中定义的数据类型相对应。

注意

上传到数据源时,所有小数值的小数位数均应为 2。 也就是说,小数点后面应为 2 位数。 所有时间戳值都应以 MM/DD/YYYY HH24:MI:SS 格式上传到数据源。

还可以查看有关测试数据的详细信息

资源:

NycTaxiGreen 表说明

下表提供了有关“NycTaxiGreen”表中每个字段的更多信息:

名称 Type 描述
RecordID Integer 原始记录 ID 顺序。 由于是随机采样,因此 CSV 的开头是无序的。 此字段可用作表的主键。
VendorID Integer 指示提供程序的代码。
lpep_pickup_datetime 时间戳 不包括时区信息。 如果数据源需要,则应使用 UTC。
Lpep_dropoff_datetime 时间戳 不包括时区信息。 如果数据源需要,则应使用 UTC。
store_and_fwd_flag 布尔 true/false 字段。 如果未指定字段类型,某些数据源可能会将此字段导入为字符或字符串。 出于测试目的,应将该字段指定为布尔值。
RatecodeID Integer 行程结束时实行的费率代码。
PULocationID Integer 使用出租车计价器的 TLC 出租车区域。
DOLocationID Integer 未使用出租车计价器的 TLC 出租车区域。
passenger_count Integer 车辆中的乘客人数。
trip_distance 双精度 经过的行程距离(以英里为单位)。
fare_amount 双精度 按时间和距离计算的车费。 2 位小数
extra 双精度 其他费用。 2 位小数
mta_tax 双精度 含 MTA 税。 2 位小数
tip_amount 双精度 小费金额。 2 位小数
tolls_amount 双精度 行程中支付的通行费总数。 2 位小数
improvement_surcharge 双精度 改善附加费。 2 位小数
total_amount 双精度 向客户收取的总价格。 不含小费。 2 位小数
payment_type Integer 表示乘客支付方式的数字代码。
trip_type Integer 表示出租车是招停还是调派的数字代码。
congestion_surcharge 双精度 额外的拥堵费。 2 位小数

TaxiZoneLookup 表说明

下表提供了有关“TaxiZoneLookup”表中每个字段的更多信息:

名称 Type 描述
LocationId Integer 任何位置的位置 ID。 它映射到“NycTaxiGreen”表中的 PULocationIDDOLocationID。 此字段可用作表的主键。
行政区 字符串 位置所在的行政区。
区域 字符串 位置所在区域的名称。
service_zone 字符串 位置所在服务区域的名称。

结束语

本节介绍了标准化测试套件中使用的测试数据及其架构。 数据库现在应该填充基于具有正确架构的指定 CSV 文件的表。

在下一部分中,你将了解测试套件的不同部分,这有助于验证数据集和扩展连接器的设置。

后续步骤

Power Query SDK 测试框架第 3 部分 - 测试套件