Del via


Power Query SDK-teststruktur del 2 – Test data

Denne reference med flere dele dækker konfiguration og kørsel af en standardpakke med test til udviklere af Power Query-connectors. Referencen er beregnet til at blive fulgt sekventielt for at sikre, at dit miljø er konfigureret til at teste din udvidelsesconnector.

I dette afsnit kan du:

  • Få mere at vide om det datasæt, der bruges i standardpakken til testene
  • Download en kopi af testdataene
  • Upload dataene til dit valg af database for den connector, du vil teste

I dette afsnit beskrives de testdata, der bruges af testpakken til at bekræfte din connector.

Oversigt over datasættet

De testdata, der bruges til strukturen, er en ændret version af de grønne TLC-data (NewYork City Taxi & Limousine Commission).

De grønne turdata fra februar 2023 blev konverteret til CSV-filen "NycTaxiGreen", og der blev udtaget stikprøver af 10.000 rækker. På samme måde indeholder CSV-filen "TaxiZoneLookup" 265 rækker fra opslagstabellen for taxazonen. CSV-dataformatet blev valgt på grund af dets store anvendelighed på næsten alle andre datakilder, hvilket gør det nemmere at importere.

Definitionen af hvert felt kan være en smule forskellig fra de oplysninger, der findes i det grønne datasæt Taxi og Limousine – Azure Open Datasets og data_dictionary_trip_records_green.pdf (nyc.gov).

Datasættet til vores test er opdelt i to csv-filer: NycTaxiGreen og TaxiZoneLookup.

Hentning af testdataene

Testdataene placeres i git-lageret data Forbind orer. Testdata leveres i form af CSV sammen med skemadefinitionen for tabellerne NycTaxiGreen og TaxiZoneLookup. Disse data skal indlæses i datakilden som separate tabeller, og du skal sikre, at skemaet svarer til de datatyper, der er defineret i datakilden.

Bemærk

Under upload til datakilden skal alle decimalværdier have en skala på 2. Dvs. at antallet af cifre efter decimaltegnet skal være 2. Alle tidsstempelværdier skal uploades til dataouceen i MM/DD/YYYY HH24:MI:SS formatet.

Du kan også gennemse oplysningerne om testdataene.

Ressourcer:

Tabelbeskrivelse af NycTaxiGreen

Følgende tabel indeholder yderligere oplysninger om hvert felt i tabellen "NycTaxiGreen":

Name Skriv Description
Recordid Heltal Den oprindelige post-id-rækkefølge. CSV starter med, at den er i out-of-order på grund af den tilfældige stikprøvetagning. Dette felt kan bruges som den primære nøgle i tabellen.
Leverandør-id Heltal Kode, der angiver udbyder.
lpep_pickup_datetime Timestamp Tidszoneoplysninger er ikke inkluderet. Hvis datakilden kræver en, skal UTC bruges.
lpep_dropoff_datetime Timestamp Tidszoneoplysninger er ikke inkluderet. Hvis datakilden kræver en, skal UTC bruges.
store_and_fwd_flag Boolean Et true/false-felt. Nogle datakilder importerer muligvis dette felt som et tegn eller en streng, hvis felttypen ikke er angivet. Med henblik på test skal dette felt angives som boolesk.
RatecodeID Heltal Bedøm kode, der er i kraft ved afslutningen af turen.
PULocationID Heltal TLC-taxazone, når taxameteret tilkobles.
DOLocationID Heltal TLC-taxazone, når taxameteret er slået fra.
passenger_count Heltal Antal passagerer i køretøjet.
trip_distance Dobbelt Forløbet turafstand i miles.
fare_amount Dobbelt Time-and-distance takst. To decimaler .
Ekstra Dobbelt Tillægsgebyrer. To decimaler .
mta_tax Dobbelt MTA-afgift tilføjet. To decimaler .
tip_amount Dobbelt Tipmængde. To decimaler .
tolls_amount Dobbelt Det samlede antal afgifter, der betales på turen. To decimaler .
improvement_surcharge Dobbelt Et forbedringstillæg. To decimaler .
total_amount Dobbelt Samlet pris, der opkræves af kunder. Indeholder ikke tip. To decimaler .
payment_type Heltal En numerisk kode for, hvordan passageren betalte.
trip_type Heltal En numerisk kode for, om taxaen blev prajet eller afsendt.
congestion_surcharge Dobbelt Et ekstra gebyr for overbelastning. To decimaler .

Beskrivelse af tabellen TaxiZoneLookup

Følgende tabel indeholder flere oplysninger om hvert felt i tabellen "TaxiZoneLookup":

Name Skriv Description
LocationId Heltal Placerings-id for enhver placering. Den knyttes til PULocationID og DOLocationID i tabellen "NycTaxiGreen". Dette felt kan bruges som den primære nøgle i tabellen.
Borough String Borough for placeringen.
Zone String Navnet på zonen for placeringen.
service_zone String Navnet på servicezonen for placeringen.

Konklusion

I dette afsnit beskrives de testdata, der bruges i den standardiserede testpakke og dens skema. Databasen skal nu udfyldes med tabeller, der er baseret på de angivne CSV-filer med det korrekte skema.

I næste afsnit får du en forståelse af forskellige afsnit i testpakken, der hjælper dig med at validere konfigurationen af datasættet og din udvidelsesconnector.

Næste trin

PowerQuery SDK-teststruktur del 3 – Testpakke