次の方法で共有


Power Query SDK テスト フレームワーク パート 2 - テスト データ

このマルチパート リファレンスでは、Power Query コネクタ開発者向けの標準テスト スイートのセットアップと実行について説明します。 このリファレンスは、拡張コネクタをテストするために環境が設定されていることを確認するため、順番に従う必要があります。

このセクションでは、次の作業を行います。

  • 標準テスト スイートで使用されるデータセットについて説明
  • テスト データのコピーをダウンロードする
  • テストするコネクタの選択したデータベースにデータをアップロードする

このセクションでは、コネクタを検証するためにテスト スイートが使用するテスト データについて説明します。

データセットの概要

フレームワークに使用されるテスト データは、NYC タクシー&リムジン協会(TLC)の緑乗車レコード データの変更されたバージョンです。

2023 年 2 月の緑乗車データが「NycTaxiGreen」CSV ファイルに変換され、そこから 10,000 行がサンプリングされました。 同様に、「TaxiZoneLookup」CSV ファイルには、タクシー ゾーンのルックアップ テーブルから 265 行が含まれています。 CSV データ形式は、その他のほぼすべてのデータ ソースに対する高い適用性のために選択され、インポートが容易になりました。

各フィールドの定義は、「NYC タクシー&リムジンの緑データセット - Azure Open Datasets」と「data_dictionary_trip_records_green.pdf (nyc.gov)」に記載されている情報とは多少異なる場合があります。

テスト用のデータセットは、NycTaxiGreenTaxiZoneLookup の 2 つの csv ファイルに分割されています。

テスト データの取得

テスト データは、データ コネクタ Git リポジトリに配置されます。 テスト データは、NYCTaxiGreen テーブルと TaxiZoneLookup テーブルのスキーマ定義と共に CSV 形式で提供されます。 このデータは、個別のテーブルとしてデータ ソースに読み込む必要があり、スキーマがデータ ソースで定義されているデータ型に対応していることを確認する必要があります。

Note

データ ソースへのアップロード時、すべての 10 進値は小数点以下桁数が 2 である必要があります。 つまり、小数点以下の桁数は 2 である必要があります。 すべてのタイムスタンプ値は、MM/DD/YYYY HH24:MI:SS 形式でデータソースにアップロードする必要があります。

テスト データに関する詳細を確認することもできます。

リソース:

NycTaxiGreen テーブルの説明

次の表では、「NycTaxiGreen」テーブルの各フィールドに関する詳細情報が示されています。

名前 種類 説明
RecordID Integer 元のレコード ID の順序。 CSV は、ランダム サンプリングのために順不同で開始されます。 このフィールドは、テーブルの主キーとして使用できます。
VendorID Integer プロバイダーを示すコード。
lpep_pickup_datetime Timestamp タイムゾーン情報は含まれません。 データ ソースに必要な場合、UTC が使用されます。
lpep_dropoff_datetime Timestamp タイムゾーン情報は含まれません。 データ ソースに必要な場合、UTC が使用されます。
store_and_fwd_flag Boolean True/False フィールド。 一部のデータ ソースは、フィールドの種類が指定されていない場合、このフィールドを文字または文字列としてインポートする場合があります。 テスト用途のため、このフィールドはブール値として指定する必要があります。
RatecodeID Integer 乗車終了時に適用される料金コード。
PULocationID Integer タクシーメーターが開始した TLC タクシー ゾーン。
DOLocationID Integer タクシーメーターが終了した TLC タクシー ゾーン。
passenger_count Integer 乗車人数。
trip_distance 倍精度浮動小数点型 マイル単位で発生した乗車距離。
fare_amount 倍精度浮動小数点型 時間と距離の料金。 小数点以下の 2 桁
extra 倍精度浮動小数点型 その他の料金。 小数点以下の 2 桁
mta_tax 倍精度浮動小数点型 MTA 税が追加されました。 小数点以下の 2 桁
tip_amount 倍精度浮動小数点型 チップの金額。 小数点以下の 2 桁
tolls_amount 倍精度浮動小数点型 乗車中に支払われた通行料の合計数。 小数点以下の 2 桁
improvement_surcharge 倍精度浮動小数点型 改善の追加料金。 小数点以下の 2 桁
total_amount 倍精度浮動小数点型 顧客に請求される合計価格。 チップは含まれません。 小数点以下の 2 桁
payment_type Integer 乗客が料金を支払った方法を示す数値コード。
trip_type Integer タクシーを呼び出しまたは配車のいずれかを示す数値コード。
congestion_surcharge 倍精度浮動小数点型 渋滞の追加料金。 小数点以下の 2 桁

TaxiZoneLookup テーブルの説明

次のテーブルは、「TaxiZoneLookup」テーブルの各フィールドの詳細を示しています。

名前 種類 説明
LocationId Integer 任意の場所の場所 ID。 「NycTaxiGreen」テーブルの PULocationIDDOLocationID にマッピングします。 このフィールドは、テーブルの主キーとして使用できます。
String 場所の自治区。
ゾーン String 場所のゾーンの名前。
service_zone String 場所のサービス ゾーンの名前。

まとめ

このセクションでは、標準化されたテスト スイートとそのスキーマ内で使用されるテスト データについて説明しました。 データベースは、指定された CSV ファイルに基づき、正しいスキーマを持つテーブルで設定されるようになりました。

次のセクションでは、データセットと拡張コネクタのセットアップを検証するために役立つテスト スイートのさまざまなセクションについて説明します。

次のステップ

PowerQuery SDK テスト フレームワーク パート 3 - テスト スイート