다음을 통해 공유


파워 쿼리 SDK 테스트 프레임워크 파트 2 - 테스트 데이터

이 다중 파트 참조는 파워 쿼리 커넥터 개발자를 위한 표준 테스트 제품군의 설정 및 실행에 대해 설명합니다. 이 참조는 확장 커넥터 테스트를 위해 환경이 설정되었는지 확인하기 위해 순차적으로 수행되어야 합니다.

이 섹션에서는 다음을 수행합니다.

  • 테스트의 표준 제품군에 사용되는 데이터 세트에 대해 알아봅니다.
  • 테스트 데이터의 복사본 다운로드
  • 테스트하려는 커넥터에 대해 선택한 데이터베이스에 데이터 업로드

이 섹션에서는 테스트 도구 모음에서 커넥터를 확인하는 데 사용하는 테스트 데이터에 대해 설명합니다.

데이터 세트 개요

프레임워크에 사용되는 테스트 데이터는 TLC(NewYork City Taxi & Limousine Commission) 녹색 여정 레코드 데이터의 수정된 버전입니다.

2023년 2월 녹색 여행 데이터는 "NycTaxiGreen" CSV 파일로 변환되었으며 10,000개의 행이 샘플링되었습니다. 마찬가지로 "TaxiZoneLookup" CSV 파일에는 택시 영역 조회 테이블의 265개 행이 포함되어 있습니다. CSV 데이터 형식은 거의 모든 다른 데이터 원본에 대한 큰 적용 가능성으로 인해 선택되어 가져오기가 더 쉬워집니다.

각 필드에 대한 정의는 NYC Taxi 및 Limousine 녹색 데이터 세트인 Azure Open Datasetsdata_dictionary_trip_records_green.pdf(nyc.gov)에 있는 정보와 약간 다를 수 있습니다.

테스트를 위한 데이터 세트는 두 개의 csv 파일 인 NycTaxiGreenTaxiZoneLookup으로 분할됩니다.

테스트 데이터 가져오기

테스트 데이터는 데이터 커넥트ors git 리포지토리에 배치됩니다. 테스트 데이터는 NycTaxiGreen 및 TaxiZoneLookup 테이블에 대한 스키마 정의함께 CSV 형식으로 제공됩니다. 이 데이터는 별도의 테이블로 데이터 원본에 로드되어야 하며 스키마가 데이터 원본에 정의된 데이터 형식에 해당하는지 확인해야 합니다.

참고 항목

데이터 원본에 업로드하는 동안 모든 소수 자릿수는 2여야 합니다. 즉, 소수점 뒤의 자릿수는 2여야 합니다. 모든 타임스탬프 값은 형식으로 datasouce에 MM/DD/YYYY HH24:MI:SS 업로드되어야 합니다.

테스트 데이터에 대한 세부 정보를 검토할 수도 있습니다.

리소스:

NycTaxiGreen 테이블 설명

다음 표에서는 "NycTaxiGreen" 테이블의 각 필드에 대한 추가 정보를 제공합니다.

속성 형식 설명
RecordID 정수 원래 레코드 ID 순서입니다. CSV는 무작위 샘플링으로 인해 순서가 바깥으로 시작됩니다. 이 필드는 테이블의 기본 키로 사용할 수 있습니다.
VendorID 정수 공급자를 나타내는 코드입니다.
lpep_pickup_datetime 타임스탬프 표준 시간대 정보는 포함되지 않습니다. 데이터 원본에 필요한 경우 UTC를 사용해야 합니다.
lpep_dropoff_datetime 타임스탬프 표준 시간대 정보는 포함되지 않습니다. 데이터 원본에 필요한 경우 UTC를 사용해야 합니다.
store_and_fwd_flag Boolean true/false 필드입니다. 필드 형식이 지정되지 않은 경우 일부 데이터 원본에서 이 필드를 문자 또는 문자열로 가져올 수 있습니다. 테스트를 위해 이 필드를 부울로 지정해야 합니다.
RatecodeID 정수 여정이 끝날 때 적용되는 속도 코드입니다.
PULocationID 정수 택시 분석기가 참여할 때의 TLC 택시 영역입니다.
DOLocationID 정수 택시 분석기가 분리된 경우의 TLC 택시 영역입니다.
passenger_count 정수 차량의 승객 수입니다.
trip_distance 두 배 경과된 여정 거리(마일)입니다.
fare_amount 두 배 시간 및 거리 요금입니다. 10진 수 두 자리입니다.
extra 두 배 기타 요금. 10진 수 두 자리입니다.
mta_tax 두 배 MTA 세금이 추가되었습니다. 10진 수 두 자리입니다.
tip_amount 두 배 팁 금액입니다. 10진 수 두 자리입니다.
tolls_amount 두 배 여정에 지불된 총 통행료 수입니다. 10진 수 두 자리입니다.
improvement_surcharge 두 배 개선된 추가 요금입니다. 10진 수 두 자리입니다.
total_amount 두 배 고객에게 청구된 총 가격입니다. 팁은 포함하지 않습니다. 10진 수 두 자리입니다.
payment_type 정수 승객이 지불한 방식에 대한 숫자 코드입니다.
trip_type 정수 택시가 운송되었는지 또는 디스패치되었는지에 대한 숫자 코드입니다.
congestion_surcharge 두 배 혼잡에 대한 추가 요금. 10진 수 두 자리입니다.

TaxiZoneLookup 테이블 설명

다음 표에서는 "TaxiZoneLookup" 테이블의 각 필드에 대한 추가 정보를 제공합니다.

속성 형식 설명
LocationId 정수 모든 위치의 위치 ID입니다. "NycTaxiGreen" 테이블의 PULocationIDDOLocationID에 매핑됩니다. 이 필드는 테이블의 기본 키로 사용할 수 있습니다.
자치 구역 문자열 위치에 대한 자치구입니다.
영역 문자열 위치의 영역 이름입니다.
service_zone 문자열 위치에 대한 서비스 영역의 이름입니다.

결론

이 섹션에서는 표준화된 테스트 도구 모음 및 해당 스키마 내에서 사용되는 테스트 데이터에 대해 설명했습니다. 이제 데이터베이스가 올바른 스키마를 사용하여 지정된 CSV 파일을 기반으로 테이블로 채워집니다.

다음 섹션에서는 데이터 세트 및 확장 커넥터 설정의 유효성을 검사하는 데 도움이 되는 테스트 도구 모음의 여러 섹션을 이해합니다.

다음 단계

PowerQuery SDK 테스트 프레임워크 파트 3 - 테스트 도구 모음