Dela via


Power Query SDK-testramverk del 2 – Testa data

Den här referensen i flera delar beskriver konfigurationen och körningen av en standardserie med tester för Power Query-anslutningsutvecklare. Referensen är avsedd att följas sekventiellt för att säkerställa att din miljö är konfigurerad för testning av tilläggsanslutningen.

I det här avsnittet får du:

  • Lär dig mer om datauppsättningen som används i standardpaketet för testerna
  • Ladda ned en kopia av testdata
  • Ladda upp data till valfri databas för anslutningsappen som du tänker testa

Det här avsnittet beskriver de testdata som används av testpaketet för att verifiera anslutningsappen.

Översikt över datamängden

Testdata som används för ramverket är en modifierad version av TLC-data (NewYork City Taxi & Limousine Commission).

De gröna resedata för februari 2023 konverterades till CSV-filen "NycTaxiGreen" och 10 000 rader samplades från den. På samma sätt innehåller CSV-filen "TaxiZoneLookup" 265 rader från uppslagstabellen i taxizonen. CSV-dataformatet valdes på grund av dess stora tillämplighet för nästan alla andra datakällor, vilket gör det enklare att importera.

Definitionen för varje fält kan skilja sig något från den information som finns i den gröna datauppsättningen NYC Taxi och Limousine – Azure Open Datasets och data_dictionary_trip_records_green.pdf (nyc.gov).

Datauppsättningen för vår testning är uppdelad i två csv-filer: NycTaxiGreen och TaxiZoneLookup.

Hämta testdata

Testdata placeras i git-lagringsplatsen Data Anslut ors. Testdata tillhandahålls i form av CSV tillsammans med schemadefinitionen för tabellerna NycTaxiGreen och TaxiZoneLookup. Dessa data ska läsas in till datakällan som separata tabeller och du måste se till att schemat motsvarar de datatyper som definierats i datakällan.

Kommentar

När du laddar upp till datakällan ska alla decimalvärden ha en skala på 2. Antalet siffror efter decimaltecknet ska alltså vara 2. Alla tidsstämpelvärden ska laddas upp till datamängden i MM/DD/YYYY HH24:MI:SS format.

Du kan också granska informationen om testdata.

Resurser:

Beskrivning av NycTaxiGreen-tabell

Följande tabell innehåller ytterligare information om varje fält i tabellen "NycTaxiGreen":

Namn Type Beskrivning
RecordID Integer Den ursprungliga post-ID-ordningen. CSV:en börjar med den i fel ordning på grund av den slumpmässiga samplingen. Det här fältet kan användas som primärnyckel i tabellen.
VendorID Integer Kod som anger provider.
lpep_pickup_datetime Tidsstämpel Tidszonsinformation ingår inte. Om datakällan kräver en ska UTC användas.
lpep_dropoff_datetime Tidsstämpel Tidszonsinformation ingår inte. Om datakällan kräver en ska UTC användas.
store_and_fwd_flag Booleskt Ett sant/falskt fält. Vissa datakällor kan importera det här fältet som ett tecken eller en sträng om fälttypen inte har angetts. För testning ska det här fältet anges som booleskt.
RatecodeID Integer Hastighetskod som gäller i slutet av resan.
PULocationID Integer TLC Taxi Zone när taxametern aktiveras.
DOLocationID Integer TLC Taxi Zone när taxametern kopplas från.
passenger_count Integer Antal passagerare i fordonet.
trip_distance Dubbel Förflutit reseavstånd i miles.
fare_amount Dubbel Tids- och avståndspriser. Två decimaler .
Extra Dubbel Avgiftsfel. Två decimaler .
mta_tax Dubbel MTA-skatt tillagd. Två decimaler .
tip_amount Dubbel Tipsmängd. Två decimaler .
tolls_amount Dubbel Totalt antal vägtullar som betalats på resan. Två decimaler .
improvement_surcharge Dubbel En förbättringsavgift. Två decimaler .
total_amount Dubbel Totalt pris som debiteras kunderna. Innehåller inte tips. Två decimaler .
payment_type Integer En numerisk kod för hur passageraren betalade.
trip_type Integer En numerisk kod för huruvida taxin anropades eller skickades.
congestion_surcharge Dubbel En extra avgift för överbelastning. Två decimaler .

Tabellbeskrivning för TaxiZoneLookup

Följande tabell innehåller ytterligare information om varje fält i tabellen "TaxiZoneLookup":

Namn Type Beskrivning
LocationId Integer Plats-ID för valfri plats. Den mappar till PULocationID och DOLocationID i tabellen "NycTaxiGreen". Det här fältet kan användas som primärnyckel i tabellen.
Borough String Stadsdel för platsen.
Zon String Namnet på zonen för platsen.
service_zone String Namnet på tjänstzonen för platsen.

Slutsats

I det här avsnittet beskrivs testdata som används i den standardiserade testsviten och dess schema. Databasen bör nu fyllas med tabeller baserat på de angivna CSV-filerna med rätt schema.

I nästa avsnitt får du en förståelse för olika delar av testpaketet som hjälper dig att verifiera konfigurationen av datamängden och tilläggsanslutningen.

Nästa steg

PowerQuery SDK-testramverk del 3 – Testpaket