Condividi tramite


Framework di test di Power Query SDK parte 2 - Dati di test

Questo riferimento in più parti illustra la configurazione e l'esecuzione di una suite standard di test per gli sviluppatori di connettori di Power Query. Il riferimento deve essere seguito in sequenza per assicurarsi che l'ambiente sia configurato per il test del connettore di estensione.

In questa sezione verrà illustrato come:

  • Informazioni sul set di dati usato nella suite standard dei test
  • Scaricare una copia dei dati di test
  • Caricare i dati nel database scelto per il connettore che si intende testare

Questa sezione illustra i dati di test usati dal gruppo di test per verificare il connettore.

Panoramica del set di dati

I dati di test usati per il framework sono una versione modificata dei dati dei record di viaggio verdi NewYork City Taxi & Limousine Commission (TLC).

I dati di viaggio verdi di febbraio 2023 sono stati convertiti in file CSV "NycTaxiGreen" e 10.000 righe sono state campionate da esso. Analogamente, il file CSV "TaxiZoneLookup" contiene 265 righe dalla tabella di ricerca della zona di taxi. Il formato di dati CSV è stato scelto a causa dell'applicabilità elevata a quasi tutte le altre origini dati, semplificando l'importazione.

La definizione per ogni campo potrebbe essere leggermente diversa dalle informazioni disponibili nel set di dati verde NYC Taxi e Limousine - Set di dati aperti di Azure e data_dictionary_trip_records_green.pdf (nyc.gov).The definition for each field might be leggermente different from the information found in NYC Taxi and Limousine green datasets - Azure Open Datasets and data_dictionary_trip_records_green.pdf (nyc.gov).

Il set di dati per il test viene suddiviso in due file CSV: NycTaxiGreen e TaxiZoneLookup.

Recupero dei dati di test

I dati di test vengono inseriti nel repository Git data Connessione ors. I dati di test vengono forniti sotto forma di CSV insieme alla definizione dello schema per le tabelle NycTaxiGreen e TaxiZoneLookup . Questi dati devono essere caricati nell'origine dati come tabelle separate ed è necessario assicurarsi che lo schema corrisponda ai tipi di dati definiti nell'origine dati.

Nota

Durante il caricamento nell'origine dati, tutti i valori decimali devono avere una scala pari a 2. Ovvero, il numero di cifre dopo il separatore decimale deve essere 2. Tutti i valori di timestamp devono essere caricati nel MM/DD/YYYY HH24:MI:SS formato datasouce.

È anche possibile esaminare i dettagli relativi ai dati di test.

Risorse:

Descrizione della tabella NycTaxiGreen

La tabella seguente fornisce ulteriori informazioni su ogni campo nella tabella "NycTaxiGreen":

Nome Tipo Descrizione
RecordID Intero Ordine id record originale. Il file CSV inizia con esso non in ordine a causa del campionamento casuale. Questo campo può essere usato come chiave primaria della tabella.
VendorID Intero Codice che indica il provider.
lpep_pickup_datetime Timestamp: Le informazioni sul fuso orario non sono incluse. Se l'origine dati richiede una, è necessario usare l'ora UTC.
lpep_dropoff_datetime Timestamp: Le informazioni sul fuso orario non sono incluse. Se l'origine dati richiede una, è necessario usare l'ora UTC.
store_and_fwd_flag Booleano Campo true/false. Alcune origini dati possono importare questo campo come carattere o stringa se il tipo di campo non è specificato. Ai fini del test, questo campo deve essere specificato come booleano.
RatecodeID Intero Codice di frequenza in vigore alla fine del viaggio.
PULocationID Intero Zona taxi TLC quando il taximetro è impegnato.
DOLocationID Intero TLC Taxi Zone quando il taximeter non è stato scollegato.
passenger_count Intero Numero di passeggeri nel veicolo.
trip_distance Double Distanza di viaggio trascorsa in miglia.
fare_amount Double Tariffa oraria e distanza. Due posizioni decimali .
extra Double Addebiti misc. Due posizioni decimali .
mta_tax Double Imposta MTA aggiunta. Due posizioni decimali .
tip_amount Double Importo mancia. Due posizioni decimali .
tolls_amount Double Numero totale di pedaggi pagati per il viaggio. Due posizioni decimali .
improvement_surcharge Double Un supplemento di miglioramento. Due posizioni decimali .
total_amount Double Prezzo totale addebitato ai clienti. Non include suggerimenti. Due posizioni decimali .
payment_type Intero Codice numerico per il modo in cui il passeggero ha pagato.
trip_type Intero Codice numerico per il fatto che il taxi sia stato o meno accolto o inviato.
congestion_surcharge Double Un costo aggiuntivo per la congestione. Due posizioni decimali .

Descrizione della tabella TaxiZoneLookup

La tabella seguente fornisce ulteriori informazioni su ogni campo nella tabella "TaxiZoneLookup":

Nome Tipo Descrizione
LocationId Intero ID posizione per qualsiasi posizione. Esegue il mapping a PULocationID e DOLocationID nella tabella "NycTaxiGreen". Questo campo può essere usato come chiave primaria della tabella.
Borough String Borough per la località.
Zona String Nome della zona per la località.
service_zone String Nome dell'area di servizio per la località.

Conclusione

Questa sezione descrive i dati di test usati all'interno del gruppo di test standardizzato e del relativo schema. Il database dovrebbe ora essere popolato con tabelle in base ai file CSV specificati con lo schema corretto.

Nella sezione successiva si acquisiscono informazioni sulle diverse sezioni del gruppo di test che consentono di convalidare la configurazione del set di dati e del connettore di estensione.

Passaggi successivi

Framework di test di PowerQuery SDK parte 3 - Gruppo di test