Πλαίσιο δοκιμής SDK Power Query, μέρος 2 - Δοκιμή δεδομένων
Αυτή η αναφορά σε πολλά μέρη καλύπτει τη ρύθμιση και την εκτέλεση μιας τυπικής οικογένειας δοκιμών για προγραμματιστές συνδέσεων Power Query. Η αναφορά προορίζεται να ακολουθηθεί διαδοχικά για να διασφαλιστεί ότι το περιβάλλον σας έχει ρυθμιστεί για τη δοκιμή της σύνδεσης επέκτασης.
Σε αυτήν την ενότητα, θα κάνετε τα εξής:
- Μάθετε σχετικά με το σύνολο δεδομένων που χρησιμοποιείται στην τυπική οικογένεια δοκιμών
- Λήψη αντιγράφου των δεδομένων δοκιμής
- Αποστολή των δεδομένων στην επιλογή σας βάσης δεδομένων για τη σύνδεση που σκοπεύετε να δοκιμάσετε
Αυτή η ενότητα καλύπτει τα δεδομένα δοκιμής που χρησιμοποιούνται από την οικογένεια δοκιμών για την επαλήθευση της σύνδεσής σας.
Επισκόπηση του συνόλου δεδομένων
Τα δεδομένα δοκιμής που χρησιμοποιούνται για το πλαίσιο είναι μια τροποποιημένη έκδοση των δεδομένων εγγραφής πράσινης διαδρομής της Επιτροπής Ταξί πόλης NewYork & Λιμουζίνας (TLC ).
Τα δεδομένα πράσινης διαδρομής του Φεβρουαρίου 2023 μετατράπηκαν σε αρχείο CSV "NycTaxiGreen" και έγινε δειγματοληψία 10.000 γραμμών από αυτό. Παρομοίως, το αρχείο CSV "TaxiZoneLookup" περιέχει 265 γραμμές από τον πίνακα αναζήτησης ζώνης ταξί. Η μορφή δεδομένων CSV επιλέχθηκε λόγω της μεγάλης δυνατότητάς της για σχεδόν όλες τις άλλες προελεύσεις δεδομένων, διευκολύνοντας την εισαγωγή.
Ο ορισμός για κάθε πεδίο μπορεί να διαφέρει ελαφρώς από τις πληροφορίες που υπάρχουν στο πράσινο σύνολο δεδομένων για τα ταξί NYC και τις λιμουζίνες - Azure Open Datasets και data_dictionary_trip_records_green.pdf (nyc.gov).
Το σύνολο δεδομένων για τις δοκιμές μας διαιρείται σε δύο αρχεία csv: NycTaxiGreen και TaxiZoneLookup.
Λήψη των δεδομένων δοκιμής
Τα δεδομένα δοκιμής τοποθετούνται στο git repo Σύνδεση ors δεδομένων. Τα δεδομένα δοκιμής παρέχονται με τη μορφή CSV μαζί με τον ορισμό σχήματος για τους πίνακες NycTaxiGreen και TaxiZoneLookup . Αυτά τα δεδομένα θα πρέπει να φορτωθούν στην προέλευση δεδομένων σας ως ξεχωριστοί πίνακες και πρέπει να εξασφαλίσετε ότι το σχήμα αντιστοιχεί στους τύπους δεδομένων που ορίζονται στην προέλευση δεδομένων σας.
Σημείωμα
Κατά την αποστολή στην προέλευση δεδομένων, όλες οι δεκαδικές τιμές πρέπει να έχουν κλίμακα 2. Αυτό σημαίνει ότι ο αριθμός των ψηφίων μετά την υποδιαστολή πρέπει να είναι 2.
Όλες οι τιμές χρονικής σήμανσης πρέπει να αποστέλλονται στο σύνολο δεδομένων σε MM/DD/YYYY HH24:MI:SS
μορφή.
Μπορείτε επίσης να εξετάσετε τις λεπτομέρειες σχετικά με τα δεδομένα δοκιμής.
Πόροι:
Περιγραφή πίνακα NycTaxiGreen
Ο παρακάτω πίνακας παρέχει περισσότερες πληροφορίες σχετικά με κάθε πεδίο στον πίνακα "NycTaxiGreen":
Ονομασία | Τύπος | Description |
---|---|---|
Recordid | Integer | Η αρχική σειρά αναγνωριστικών εγγραφών. Ο CSV ξεκινά με εκτός σειράς λόγω τυχαίας δειγματοληψίας. Αυτό το πεδίο μπορεί να χρησιμοποιηθεί ως πρωτεύον κλειδί του πίνακα. |
Αναγνωριστικό προμηθευτή | Integer | Κωδικός που υποδεικνύει την υπηρεσία παροχής. |
lpep_pickup_datetime | Χρονική σήμανση | Οι πληροφορίες ζώνης ώρας δεν περιλαμβάνονται. Εάν η προέλευση δεδομένων απαιτεί ένα, θα πρέπει να χρησιμοποιηθεί η συνάρτηση UTC. |
lpep_dropoff_datetime | Χρονική σήμανση | Οι πληροφορίες ζώνης ώρας δεν περιλαμβάνονται. Εάν η προέλευση δεδομένων απαιτεί ένα, θα πρέπει να χρησιμοποιηθεί η συνάρτηση UTC. |
store_and_fwd_flag | Boolean | Ένα πεδίο true/false. Ορισμένες προελεύσεις δεδομένων μπορεί να εισαγάγουν αυτό το πεδίο ως χαρακτήρα ή συμβολοσειρά, εάν δεν έχει καθοριστεί ο τύπος πεδίου. Για τους σκοπούς της δοκιμής, αυτό το πεδίο πρέπει να καθοριστεί ως Δυαδική τιμή. |
Αναγνωριστικό κωδικού ρυθμού | Integer | Κωδικός τιμής σε ισχύ στο τέλος της διαδρομής. |
PULocationID | Integer | Η ζώνη ταξί TLC όταν ενεργοποιήθηκε ο ταξίμετρος. |
DOLocationID | Integer | Η ζώνη ταξί TLC όταν απενεργοποιήθηκε ο μετρητής. |
passenger_count | Integer | Αριθμός επιβατών στο όχημα. |
trip_distance | Διπλή | Απόσταση διαδρομής που έχει παρέλθει σε μίλια. |
fare_amount | Διπλή | Ναύλο χρόνου και απόστασης. Δύο δεκαδικά ψηφία . |
Επιπλέον | Διπλή | Χρεώσεις εσφαλμένης χρήσης. Δύο δεκαδικά ψηφία . |
mta_tax | Διπλή | Προστέθηκε φόρος MTA. Δύο δεκαδικά ψηφία . |
tip_amount | Διπλή | Ποσό συμβουλής. Δύο δεκαδικά ψηφία . |
tolls_amount | Διπλή | Συνολικός αριθμός διοδίων που πληρώθηκαν στη διαδρομή. Δύο δεκαδικά ψηφία . |
improvement_surcharge | Διπλή | Με επιπλέον χρέωση βελτίωσης. Δύο δεκαδικά ψηφία . |
total_amount | Διπλή | Συνολική τιμή που χρεώθηκε στους πελάτες. Δεν περιλαμβάνει συμβουλές. Δύο δεκαδικά ψηφία . |
payment_type | Integer | Ένας αριθμητικός κωδικός για τον τρόπο πληρωμής του επιβάτη. |
trip_type | Integer | Ένας αριθμητικός κωδικός για το αν το ταξί χαιρετίστηκε ή στάλθηκε. |
congestion_surcharge | Διπλή | Επιπλέον χρέωση για συμφόρηση. Δύο δεκαδικά ψηφία . |
Περιγραφή πίνακα TaxiZoneLookup
Ο παρακάτω πίνακας παρέχει περισσότερες πληροφορίες σχετικά με κάθε πεδίο στον πίνακα "TaxiZoneLookup":
Ονομασία | Τύπος | Description |
---|---|---|
Αναγνωριστικό τοποθεσίας | Integer | Αναγνωριστικό τοποθεσίας για οποιαδήποτε τοποθεσία. Αντιστοιχίζεται στα PULocationID και DOLocationID στον πίνακα "NycTaxiGreen". Αυτό το πεδίο μπορεί να χρησιμοποιηθεί ως πρωτεύον κλειδί του πίνακα. |
Δήμο | Συμβολοσειρά | Δήμος για την τοποθεσία. |
Ζώνη | Συμβολοσειρά | Το όνομα της ζώνης για την τοποθεσία. |
service_zone | Συμβολοσειρά | Το όνομα της ζώνης υπηρεσίας για την τοποθεσία. |
Συμπέρασμα
Αυτή η ενότητα περιέγραψε τα δεδομένα δοκιμής που χρησιμοποιούνται μέσα στην τυποποιημένη οικογένεια δοκιμών και το σχήμα της. Η βάση δεδομένων σας θα πρέπει τώρα να συμπληρώνεται με πίνακες που βασίζονται στα καθορισμένα αρχεία CSV με το σωστό σχήμα.
Στην επόμενη ενότητα, θα κατανοήσετε διαφορετικές ενότητες της οικογένειας δοκιμών που σας βοηθά να επικυρώσετε τη ρύθμιση του συνόλου δεδομένων και της σύνδεσης επέκτασης.