Power Query SDK テスト フレームワーク パート 2 - テスト データ
このマルチパート リファレンスでは、Power Query コネクタ開発者向けの標準テスト スイートのセットアップと実行について説明します。 このリファレンスは、拡張コネクタをテストするために環境が設定されていることを確認するため、順番に従う必要があります。
このセクションでは、次の作業を行います。
- 標準テスト スイートで使用されるデータセットについて説明
- テスト データのコピーをダウンロードする
- テストするコネクタの選択したデータベースにデータをアップロードする
このセクションでは、コネクタを検証するためにテスト スイートが使用するテスト データについて説明します。
データセットの概要
フレームワークに使用されるテスト データは、NYC タクシー&リムジン協会(TLC)の緑乗車レコード データの変更されたバージョンです。
2023 年 2 月の緑乗車データが「NycTaxiGreen」CSV ファイルに変換され、そこから 10,000 行がサンプリングされました。 同様に、「TaxiZoneLookup」CSV ファイルには、タクシー ゾーンのルックアップ テーブルから 265 行が含まれています。 CSV データ形式は、その他のほぼすべてのデータ ソースに対する高い適用性のために選択され、インポートが容易になりました。
各フィールドの定義は、「NYC タクシー&リムジンの緑データセット - Azure Open Datasets」と「data_dictionary_trip_records_green.pdf (nyc.gov)」に記載されている情報とは多少異なる場合があります。
テスト用のデータセットは、NycTaxiGreen と TaxiZoneLookup の 2 つの csv ファイルに分割されています。
テスト データの取得
テスト データは、データ コネクタ Git リポジトリに配置されます。 テスト データは、NYCTaxiGreen テーブルと TaxiZoneLookup テーブルのスキーマ定義と共に CSV 形式で提供されます。 このデータは、個別のテーブルとしてデータ ソースに読み込む必要があり、スキーマがデータ ソースで定義されているデータ型に対応していることを確認する必要があります。
Note
データ ソースへのアップロード時、すべての 10 進値は小数点以下桁数が 2 である必要があります。 つまり、小数点以下の桁数は 2 である必要があります。
すべてのタイムスタンプ値は、MM/DD/YYYY HH24:MI:SS
形式でデータソースにアップロードする必要があります。
テスト データに関する詳細を確認することもできます。
リソース:
NycTaxiGreen テーブルの説明
次の表では、「NycTaxiGreen」テーブルの各フィールドに関する詳細情報が示されています。
名前 | 種類 | 説明 |
---|---|---|
RecordID | Integer | 元のレコード ID の順序。 CSV は、ランダム サンプリングのために順不同で開始されます。 このフィールドは、テーブルの主キーとして使用できます。 |
VendorID | Integer | プロバイダーを示すコード。 |
lpep_pickup_datetime | Timestamp | タイムゾーン情報は含まれません。 データ ソースに必要な場合、UTC が使用されます。 |
lpep_dropoff_datetime | Timestamp | タイムゾーン情報は含まれません。 データ ソースに必要な場合、UTC が使用されます。 |
store_and_fwd_flag | Boolean | True/False フィールド。 一部のデータ ソースは、フィールドの種類が指定されていない場合、このフィールドを文字または文字列としてインポートする場合があります。 テスト用途のため、このフィールドはブール値として指定する必要があります。 |
RatecodeID | Integer | 乗車終了時に適用される料金コード。 |
PULocationID | Integer | タクシーメーターが開始した TLC タクシー ゾーン。 |
DOLocationID | Integer | タクシーメーターが終了した TLC タクシー ゾーン。 |
passenger_count | Integer | 乗車人数。 |
trip_distance | 倍精度浮動小数点型 | マイル単位で発生した乗車距離。 |
fare_amount | 倍精度浮動小数点型 | 時間と距離の料金。 小数点以下の 2 桁。 |
extra | 倍精度浮動小数点型 | その他の料金。 小数点以下の 2 桁。 |
mta_tax | 倍精度浮動小数点型 | MTA 税が追加されました。 小数点以下の 2 桁。 |
tip_amount | 倍精度浮動小数点型 | チップの金額。 小数点以下の 2 桁。 |
tolls_amount | 倍精度浮動小数点型 | 乗車中に支払われた通行料の合計数。 小数点以下の 2 桁。 |
improvement_surcharge | 倍精度浮動小数点型 | 改善の追加料金。 小数点以下の 2 桁。 |
total_amount | 倍精度浮動小数点型 | 顧客に請求される合計価格。 チップは含まれません。 小数点以下の 2 桁。 |
payment_type | Integer | 乗客が料金を支払った方法を示す数値コード。 |
trip_type | Integer | タクシーを呼び出しまたは配車のいずれかを示す数値コード。 |
congestion_surcharge | 倍精度浮動小数点型 | 渋滞の追加料金。 小数点以下の 2 桁。 |
TaxiZoneLookup テーブルの説明
次のテーブルは、「TaxiZoneLookup」テーブルの各フィールドの詳細を示しています。
名前 | 種類 | 説明 |
---|---|---|
LocationId | Integer | 任意の場所の場所 ID。 「NycTaxiGreen」テーブルの PULocationID と DOLocationID にマッピングします。 このフィールドは、テーブルの主キーとして使用できます。 |
区 | String | 場所の自治区。 |
ゾーン | String | 場所のゾーンの名前。 |
service_zone | String | 場所のサービス ゾーンの名前。 |
まとめ
このセクションでは、標準化されたテスト スイートとそのスキーマ内で使用されるテスト データについて説明しました。 データベースは、指定された CSV ファイルに基づき、正しいスキーマを持つテーブルで設定されるようになりました。
次のセクションでは、データセットと拡張コネクタのセットアップを検証するために役立つテスト スイートのさまざまなセクションについて説明します。