Κοινή χρήση μέσω


Πλαίσιο δοκιμής SDK Power Query, μέρος 2 - Δοκιμή δεδομένων

Αυτή η αναφορά σε πολλά μέρη καλύπτει τη ρύθμιση και την εκτέλεση μιας τυπικής οικογένειας δοκιμών για προγραμματιστές συνδέσεων Power Query. Η αναφορά προορίζεται να ακολουθηθεί διαδοχικά για να διασφαλιστεί ότι το περιβάλλον σας έχει ρυθμιστεί για τη δοκιμή της σύνδεσης επέκτασης.

Σε αυτήν την ενότητα, θα κάνετε τα εξής:

  • Μάθετε σχετικά με το σύνολο δεδομένων που χρησιμοποιείται στην τυπική οικογένεια δοκιμών
  • Λήψη αντιγράφου των δεδομένων δοκιμής
  • Αποστολή των δεδομένων στην επιλογή σας βάσης δεδομένων για τη σύνδεση που σκοπεύετε να δοκιμάσετε

Αυτή η ενότητα καλύπτει τα δεδομένα δοκιμής που χρησιμοποιούνται από την οικογένεια δοκιμών για την επαλήθευση της σύνδεσής σας.

Επισκόπηση του συνόλου δεδομένων

Τα δεδομένα δοκιμής που χρησιμοποιούνται για το πλαίσιο είναι μια τροποποιημένη έκδοση των δεδομένων εγγραφής πράσινης διαδρομής της Επιτροπής Ταξί πόλης NewYork & Λιμουζίνας (TLC ).

Τα δεδομένα πράσινης διαδρομής του Φεβρουαρίου 2023 μετατράπηκαν σε αρχείο CSV "NycTaxiGreen" και έγινε δειγματοληψία 10.000 γραμμών από αυτό. Παρομοίως, το αρχείο CSV "TaxiZoneLookup" περιέχει 265 γραμμές από τον πίνακα αναζήτησης ζώνης ταξί. Η μορφή δεδομένων CSV επιλέχθηκε λόγω της μεγάλης δυνατότητάς της για σχεδόν όλες τις άλλες προελεύσεις δεδομένων, διευκολύνοντας την εισαγωγή.

Ο ορισμός για κάθε πεδίο μπορεί να διαφέρει ελαφρώς από τις πληροφορίες που υπάρχουν στο πράσινο σύνολο δεδομένων για τα ταξί NYC και τις λιμουζίνες - Azure Open Datasets και data_dictionary_trip_records_green.pdf (nyc.gov).

Το σύνολο δεδομένων για τις δοκιμές μας διαιρείται σε δύο αρχεία csv: NycTaxiGreen και TaxiZoneLookup.

Λήψη των δεδομένων δοκιμής

Τα δεδομένα δοκιμής τοποθετούνται στο git repo Σύνδεση ors δεδομένων. Τα δεδομένα δοκιμής παρέχονται με τη μορφή CSV μαζί με τον ορισμό σχήματος για τους πίνακες NycTaxiGreen και TaxiZoneLookup . Αυτά τα δεδομένα θα πρέπει να φορτωθούν στην προέλευση δεδομένων σας ως ξεχωριστοί πίνακες και πρέπει να εξασφαλίσετε ότι το σχήμα αντιστοιχεί στους τύπους δεδομένων που ορίζονται στην προέλευση δεδομένων σας.

Σημείωμα

Κατά την αποστολή στην προέλευση δεδομένων, όλες οι δεκαδικές τιμές πρέπει να έχουν κλίμακα 2. Αυτό σημαίνει ότι ο αριθμός των ψηφίων μετά την υποδιαστολή πρέπει να είναι 2. Όλες οι τιμές χρονικής σήμανσης πρέπει να αποστέλλονται στο σύνολο δεδομένων σε MM/DD/YYYY HH24:MI:SS μορφή.

Μπορείτε επίσης να εξετάσετε τις λεπτομέρειες σχετικά με τα δεδομένα δοκιμής.

Πόροι:

Περιγραφή πίνακα NycTaxiGreen

Ο παρακάτω πίνακας παρέχει περισσότερες πληροφορίες σχετικά με κάθε πεδίο στον πίνακα "NycTaxiGreen":

Ονομασία Τύπος Description
Recordid Integer Η αρχική σειρά αναγνωριστικών εγγραφών. Ο CSV ξεκινά με εκτός σειράς λόγω τυχαίας δειγματοληψίας. Αυτό το πεδίο μπορεί να χρησιμοποιηθεί ως πρωτεύον κλειδί του πίνακα.
Αναγνωριστικό προμηθευτή Integer Κωδικός που υποδεικνύει την υπηρεσία παροχής.
lpep_pickup_datetime Χρονική σήμανση Οι πληροφορίες ζώνης ώρας δεν περιλαμβάνονται. Εάν η προέλευση δεδομένων απαιτεί ένα, θα πρέπει να χρησιμοποιηθεί η συνάρτηση UTC.
lpep_dropoff_datetime Χρονική σήμανση Οι πληροφορίες ζώνης ώρας δεν περιλαμβάνονται. Εάν η προέλευση δεδομένων απαιτεί ένα, θα πρέπει να χρησιμοποιηθεί η συνάρτηση UTC.
store_and_fwd_flag Boolean Ένα πεδίο true/false. Ορισμένες προελεύσεις δεδομένων μπορεί να εισαγάγουν αυτό το πεδίο ως χαρακτήρα ή συμβολοσειρά, εάν δεν έχει καθοριστεί ο τύπος πεδίου. Για τους σκοπούς της δοκιμής, αυτό το πεδίο πρέπει να καθοριστεί ως Δυαδική τιμή.
Αναγνωριστικό κωδικού ρυθμού Integer Κωδικός τιμής σε ισχύ στο τέλος της διαδρομής.
PULocationID Integer Η ζώνη ταξί TLC όταν ενεργοποιήθηκε ο ταξίμετρος.
DOLocationID Integer Η ζώνη ταξί TLC όταν απενεργοποιήθηκε ο μετρητής.
passenger_count Integer Αριθμός επιβατών στο όχημα.
trip_distance Διπλή Απόσταση διαδρομής που έχει παρέλθει σε μίλια.
fare_amount Διπλή Ναύλο χρόνου και απόστασης. Δύο δεκαδικά ψηφία .
Επιπλέον Διπλή Χρεώσεις εσφαλμένης χρήσης. Δύο δεκαδικά ψηφία .
mta_tax Διπλή Προστέθηκε φόρος MTA. Δύο δεκαδικά ψηφία .
tip_amount Διπλή Ποσό συμβουλής. Δύο δεκαδικά ψηφία .
tolls_amount Διπλή Συνολικός αριθμός διοδίων που πληρώθηκαν στη διαδρομή. Δύο δεκαδικά ψηφία .
improvement_surcharge Διπλή Με επιπλέον χρέωση βελτίωσης. Δύο δεκαδικά ψηφία .
total_amount Διπλή Συνολική τιμή που χρεώθηκε στους πελάτες. Δεν περιλαμβάνει συμβουλές. Δύο δεκαδικά ψηφία .
payment_type Integer Ένας αριθμητικός κωδικός για τον τρόπο πληρωμής του επιβάτη.
trip_type Integer Ένας αριθμητικός κωδικός για το αν το ταξί χαιρετίστηκε ή στάλθηκε.
congestion_surcharge Διπλή Επιπλέον χρέωση για συμφόρηση. Δύο δεκαδικά ψηφία .

Περιγραφή πίνακα TaxiZoneLookup

Ο παρακάτω πίνακας παρέχει περισσότερες πληροφορίες σχετικά με κάθε πεδίο στον πίνακα "TaxiZoneLookup":

Ονομασία Τύπος Description
Αναγνωριστικό τοποθεσίας Integer Αναγνωριστικό τοποθεσίας για οποιαδήποτε τοποθεσία. Αντιστοιχίζεται στα PULocationID και DOLocationID στον πίνακα "NycTaxiGreen". Αυτό το πεδίο μπορεί να χρησιμοποιηθεί ως πρωτεύον κλειδί του πίνακα.
Δήμο Συμβολοσειρά Δήμος για την τοποθεσία.
Ζώνη Συμβολοσειρά Το όνομα της ζώνης για την τοποθεσία.
service_zone Συμβολοσειρά Το όνομα της ζώνης υπηρεσίας για την τοποθεσία.

Συμπέρασμα

Αυτή η ενότητα περιέγραψε τα δεδομένα δοκιμής που χρησιμοποιούνται μέσα στην τυποποιημένη οικογένεια δοκιμών και το σχήμα της. Η βάση δεδομένων σας θα πρέπει τώρα να συμπληρώνεται με πίνακες που βασίζονται στα καθορισμένα αρχεία CSV με το σωστό σχήμα.

Στην επόμενη ενότητα, θα κατανοήσετε διαφορετικές ενότητες της οικογένειας δοκιμών που σας βοηθά να επικυρώσετε τη ρύθμιση του συνόλου δεδομένων και της σύνδεσης επέκτασης.

Επόμενα βήματα

Πλαίσιο δοκιμής PowerQuery SDK μέρος 3 - Οικογένεια δοκιμών