Κοινή χρήση μέσω


Ρύθμιση παραμέτρων βάσης δεδομένων Azure για PostgreSQL σε δραστηριότητα αντιγραφής

Αυτό το άρθρο περιγράφει τον τρόπο χρήσης της δραστηριότητας αντιγραφής στη διοχέτευση δεδομένων για την αντιγραφή δεδομένων από το και στη Βάση δεδομένων Azure για PostgreSQL.

Υποστηριζόμενη ρύθμιση παραμέτρων

Για τη ρύθμιση παραμέτρων κάθε καρτέλας στην περιοχή δραστηριότητα αντιγραφής, μεταβείτε στις ακόλουθες ενότητες αντίστοιχα.

  • Γενικός
  • προέλευσης
  • προορισμού
  • αντιστοίχισης
  • ρυθμίσεις

Γενικά

Ανατρέξτε στις οδηγίες για τις ρυθμίσεις του Γενικά για να ρυθμίσετε τις παραμέτρους της καρτέλας ρυθμίσεις Γενικά.

Πηγή

Μεταβείτε στην καρτέλα Προέλευση για να ρυθμίσετε τις παραμέτρους της προέλευσης δραστηριότητας αντιγραφής. Ανατρέξτε στο παρακάτω περιεχόμενο για τις λεπτομερείς ρυθμίσεις παραμέτρων.

Στιγμιότυπο οθόνης που εμφανίζει την καρτέλα προέλευσης και τη λίστα ιδιοτήτων.

Οι ακόλουθες τρεις ιδιότητες είναι υποχρεωτικές:

  • σύνδεσης: Επιλέξτε μια βάση δεδομένων Azure για σύνδεση PostgreSQL από τη λίστα συνδέσεων. Εάν δεν υπάρχει σύνδεση, δημιουργήστε μια νέα βάση δεδομένων Azure για τη σύνδεση PostgreSQL.
  • τύπος σύνδεσης: Επιλέξτε βάση δεδομένων Azure για PostgreSQL.
  • Χρήσηερωτημάτων: Επιλέξτε Πίνακας για να διαβάσετε δεδομένα από τον καθορισμένο πίνακα ή επιλέξτε Ερωτήματος για την ανάγνωση δεδομένων με χρήση ερωτημάτων.
    • Εάν επιλέξετε Πίνακας:

      • Table: Επιλέξτε τον πίνακα από την αναπτυσσόμενη λίστα ή επιλέξτε Enter με μη αυτόματο τρόπο για να τον εισαγάγετε για να διαβάσετε δεδομένα.

        στιγμιότυπο οθόνης που εμφανίζει τη Χρήση ερωτήματος - Πίνακας.

    • Εάν επιλέξετε ερωτήματος:

      • ερωτήματος: Καθορίστε το προσαρμοσμένο ερώτημα SQL για ανάγνωση δεδομένων. Για παράδειγμα: SELECT * FROM mytable ή SELECT * FROM "MyTable".

        Σημείωση

        Στο PostgreSQL, το όνομα της οντότητας αντιμετωπίζεται ως χωρίς διάκριση πεζών-κεφαλαίων εάν δεν αναφέρεται σε εισαγωγικά.

        στιγμιότυπο οθόνης που εμφανίζει τη Χρήση ερωτήματος - Ερώτημα.

Στην περιοχή για προχωρημένους, μπορείτε να καθορίσετε τα ακόλουθα πεδία:

  • χρονικό όριο ερωτήματος (λεπτά): Καθορίστε τον χρόνο αναμονής πριν από τον τερματισμό της προσπάθειας εκτέλεσης μιας εντολής και τη δημιουργία σφάλματος, η προεπιλογή είναι 120 λεπτά. Εάν η παράμετρος έχει οριστεί για αυτήν την ιδιότητα, οι επιτρεπόμενες τιμές είναι χρονικό διάστημα, όπως "02:00:00" (120 λεπτά). Για περισσότερες πληροφορίες, ανατρέξτε στο θέμα CommandTimeout.

  • επιλογή διαμερίσματος: Καθορίζει τις επιλογές διαμερίσματος δεδομένων που χρησιμοποιούνται για τη φόρτωση δεδομένων από τη βάση δεδομένων Azure για PostgreSQL. Όταν είναι ενεργοποιημένη μια επιλογή διαμερίσματος (δηλαδή, όχι Καμία), ο βαθμός παραλληλισμού για την ταυτόχρονη φόρτωση δεδομένων από μια βάση δεδομένων Azure για PostgreSQL ελέγχεται από το Βαθμός παράλληλης αντιγραφής στην καρτέλα αντιγραφής ρυθμίσεων δραστηριότητας.

    Εάν επιλέξετε Καμία, επιλέγετε να μην χρησιμοποιήσετε το διαμέρισμα.

    Εάν επιλέξετε Φυσικά διαμερίσματα του πίνακα:

    • ονόματα διαμερίσματος: Καθορίστε τη λίστα των φυσικών διαμερισμάτων που πρέπει να αντιγραφούν.

      Εάν χρησιμοποιείτε ένα ερώτημα για να ανακτήσετε τα δεδομένα προέλευσης, το αγκίστρι ?AdfTabularPartitionName στον όρο WHERE. Για ένα παράδειγμα, ανατρέξτε στην ενότητα Παράλληλο αντίγραφο από βάσης δεδομένων Azure για PostgreSQL ενότητα.

      Στιγμιότυπο οθόνης που εμφανίζει τη ρύθμιση παραμέτρων όταν επιλέγετε Φυσικά διαμερίσματα πίνακα.

    Εάν επιλέξετε Δυναμική περιοχή:

    • όνομα στήλης διαμερίσματος: Καθορίστε το όνομα της στήλης προέλευσης σε ακέραιο ή τύπου ημερομηνίας/ημερομηνίας/ώρας (int, smallint, bigint, date, timestamp without time zone, timestamp with time zone ή time without time zone) που θα χρησιμοποιηθεί από τον διαμερισμό περιοχής για παράλληλο αντίγραφο. Εάν δεν καθοριστεί, το πρωτεύον κλειδί του πίνακα εντοπίζεται αυτόματα και χρησιμοποιείται ως στήλη διαμερίσματος.

      Εάν χρησιμοποιείτε ένα ερώτημα για να ανακτήσετε τα δεδομένα προέλευσης, το αγκίστρι ?AdfRangePartitionColumnName στον όρο WHERE. Για ένα παράδειγμα, ανατρέξτε στην ενότητα Παράλληλο αντίγραφο από τη βάση δεδομένων Azure για PostgreSQL.

    • διαμερίσματος στην επάνω δεσμευμένη: Καθορίστε τη μέγιστη τιμή της στήλης διαμερίσματος για αντιγραφή δεδομένων.

      Εάν χρησιμοποιείτε ένα ερώτημα για να ανακτήσετε τα δεδομένα προέλευσης, το αγκίστρι ?AdfRangePartitionUpbound στον όρο WHERE. Για ένα παράδειγμα, ανατρέξτε στην ενότητα Παράλληλο αντίγραφο από τη βάση δεδομένων Azure για PostgreSQL. .

    • Partitionκάτω όριο: Καθορίστε την ελάχιστη τιμή της στήλης διαμερίσματος για αντιγραφή δεδομένων.

      Εάν χρησιμοποιείτε ένα ερώτημα για να ανακτήσετε τα δεδομένα προέλευσης, το αγκίστρι ?AdfRangePartitionLowbound στον όρο WHERE. Για ένα παράδειγμα, ανατρέξτε στην ενότητα Παράλληλο αντίγραφο από τη βάση δεδομένων Azure για PostgreSQL.

      Στιγμιότυπο οθόνης που εμφανίζει τη ρύθμιση παραμέτρων όταν επιλέγετε Δυναμική περιοχή.

  • πρόσθετες στήλες: Προσθέστε επιπλέον στήλες δεδομένων για να αποθηκεύσετε τη σχετική διαδρομή ή τη στατική τιμή των αρχείων προέλευσης. Η παράσταση υποστηρίζεται για το τελευταίο.

Προορισμός

Μεταβείτε στην καρτέλα προορισμού για να ρυθμίσετε τις παραμέτρους του αντιγράφου προορισμού δραστηριότητας. Ανατρέξτε στο παρακάτω περιεχόμενο για τις λεπτομερείς ρυθμίσεις παραμέτρων.

Στιγμιότυπο οθόνης που εμφανίζει την καρτέλα προορισμού και τη λίστα ιδιοτήτων.

Οι ακόλουθες τρεις ιδιότητες είναι υποχρεωτικές:

  • σύνδεσης: Επιλέξτε μια βάση δεδομένων Azure για σύνδεση PostgreSQL από τη λίστα συνδέσεων. Εάν δεν υπάρχει σύνδεση, δημιουργήστε μια νέα βάση δεδομένων Azure για τη σύνδεση PostgreSQL.
  • τύπος σύνδεσης: Επιλέξτε βάση δεδομένων Azure για PostgreSQL.
  • Table: Επιλέξτε τον πίνακα από την αναπτυσσόμενη λίστα ή επιλέξτε Enter με μη αυτόματο τρόπο για να τον εισαγάγετε για να συντάξετε δεδομένα.

Στην περιοχή για προχωρημένους, μπορείτε να καθορίσετε τα ακόλουθα πεδία:

  • μεθόδου Εγγραφή: Επιλέξτε τη μέθοδο που χρησιμοποιείται για την εγγραφή δεδομένων στη βάση δεδομένων Azure για PostgreSQL. Επιλέξτε από εντολής Αντιγραφή (προεπιλογή, το οποίο έχει μεγαλύτερη απόδοση) και μαζική εισαγωγή.

  • δέσμης ενεργειών προ-αντιγραφής: Καθορίστε ένα ερώτημα SQL για την εκτέλεση της δραστηριότητας αντιγραφής, προτού γράψετε δεδομένα στη Βάση δεδομένων Azure για PostgreSQL σε κάθε εκτέλεση. Μπορείτε να χρησιμοποιήσετε αυτήν την ιδιότητα για να εκκαθαρίσετε τα προφορτωμένα δεδομένα.

  • Εγγραφήχρονικού ορίου δέσμης: Καθορίστε τον χρόνο αναμονής για την ολοκλήρωση της λειτουργίας εισαγωγής δέσμης προτού λήξει. Η επιτρεπόμενη τιμή είναι το χρονικό διάστημα. Η προεπιλεγμένη τιμή είναι 00:30:00 (30 λεπτά).

  • Εγγραφή μεγέθους δέσμης: Καθορίστε τον αριθμό των γραμμών που φορτώθηκαν στη βάση δεδομένων Azure για PostgreSQL ανά δέσμη. Η επιτρεπόμενη τιμή είναι ένας ακέραιος που αντιπροσωπεύει τον αριθμό των γραμμών. Η προεπιλεγμένη τιμή είναι 1.000.000.

Χαρτογράφηση

Για ρύθμιση παραμέτρων καρτέλας Αντιστοίχιση, ανατρέξτε στο θέμα Ρύθμιση παραμέτρων των αντιστοιχίσεων στην καρτέλα αντιστοίχισης.

Ρυθμίσεις

Για ρυθμίσεις ρύθμιση παραμέτρων καρτέλας, μεταβείτε στη Ρύθμιση παραμέτρων των άλλων ρυθμίσεων σας στην καρτέλα "Ρυθμίσεις".

Παράλληλο αντίγραφο από τη βάση δεδομένων Azure για PostgreSQL

Η σύνδεση Βάση δεδομένων Azure για PostgreSQL στη δραστηριότητα αντιγραφής παρέχει ενσωματωμένο διαμερισμό δεδομένων για παράλληλη αντιγραφή δεδομένων. Μπορείτε να βρείτε επιλογές διαμείσματος δεδομένων στην καρτέλα Source της δραστηριότητας αντιγραφής.

Όταν ενεργοποιείτε το διαμετρημένο αντίγραφο, η αντιγραφή δραστηριότητας εκτελεί παράλληλα ερωτήματα στη βάση δεδομένων Azure για την προέλευση PostgreSQL για τη φόρτωση δεδομένων κατά διαμερίσματα. Ο παράλληλος βαθμός ελέγχεται από τον Βαθμό παράλληλης αντιγραφής στην καρτέλα ρυθμίσεων δραστηριότητας αντιγραφής. Για παράδειγμα, εάν ορίσετε Βαθμός παράλληλης αντιγραφής σε τέσσερα, η υπηρεσία δημιουργεί και εκτελεί ταυτόχρονα τέσσερα ερωτήματα με βάση την καθορισμένη επιλογή διαμερίσματος και ρυθμίσεις σας και κάθε ερώτημα ανακτά ένα τμήμα δεδομένων από τη βάση δεδομένων Azure για PostgreSQL.

Σας προτείνεται να ενεργοποιήσετε την παράλληλη αντιγραφή με τον διαμερισμό δεδομένων, ιδιαίτερα όταν φορτώνετε μεγάλο όγκο δεδομένων από τη βάση δεδομένων Azure για PostgreSQL. Ακολουθούν προτεινόμενες ρυθμίσεις παραμέτρων για διαφορετικά σενάρια. Κατά την αντιγραφή δεδομένων σε χώρο αποθήκευσης δεδομένων που βασίζεται σε αρχεία, συνιστάται να γράφετε σε έναν φάκελο ως πολλαπλά αρχεία (να καθορίζετε μόνο το όνομα του φακέλου), όπου, σε αυτή την περίπτωση, οι επιδόσεις είναι καλύτερες από την εγγραφή σε ένα μόνο αρχείο.

Σενάριο Προτεινόμενες ρυθμίσεις
Πλήρης φόρτωση από μεγάλο πίνακα, με φυσικά διαμερίσματα. επιλογή διαμερίσματος: Φυσικά διαμερίσματα πίνακα.

Κατά την εκτέλεση, η υπηρεσία εντοπίζει αυτόματα τα φυσικά διαμερίσματα και αντιγράφει δεδομένα κατά διαμερίσματα.
Πλήρης φόρτωση από μεγάλο πίνακα, χωρίς φυσικά διαμερίσματα, ενώ με μια στήλη ακέραιων για διαμερισμό δεδομένων. επιλογές διαμερίσματος: Δυναμική περιοχή.
στήλη διαμερίσματος: Καθορίστε τη στήλη που χρησιμοποιείται για τον διαμερισμό δεδομένων. Εάν δεν καθοριστεί, χρησιμοποιείται η στήλη πρωτεύοντος κλειδιού.
Φορτώστε ένα μεγάλο όγκο δεδομένων χρησιμοποιώντας ένα προσαρμοσμένο ερώτημα, με φυσικά διαμερίσματα. επιλογή διαμερίσματος: Φυσικά διαμερίσματα πίνακα.
ερωτήματος: SELECT * FROM ?AdfTabularPartitionName WHERE <your_additional_where_clause>.
όνομα διαμερίσματος: Καθορίστε τα ονόματα διαμερίσματος από τα οποία θα αντιγράψετε δεδομένα. Εάν δεν καθοριστεί, η υπηρεσία εντοπίζει αυτόματα τα φυσικά διαμερίσματα στον πίνακα που καθορίσατε στο σύνολο δεδομένων PostgreSQL.

Κατά την εκτέλεση, η υπηρεσία αντικαθιστά ?AdfTabularPartitionName με το πραγματικό όνομα διαμερίσματος και αποστέλλει στη Βάση δεδομένων Azure για PostgreSQL.
Φορτώστε ένα μεγάλο όγκο δεδομένων χρησιμοποιώντας ένα προσαρμοσμένο ερώτημα, χωρίς φυσικά διαμερίσματα, ενώ με μια στήλη ακέραιων για τον διαμερισμό δεδομένων. επιλογές διαμερίσματος: Δυναμική περιοχή.
ερωτήματος: SELECT * FROM ?AdfTabularPartitionName WHERE ?AdfRangePartitionColumnName <= ?AdfRangePartitionUpbound AND ?AdfRangePartitionColumnName >= ?AdfRangePartitionLowbound AND <your_additional_where_clause>.
στήλη διαμερίσματος: Καθορίστε τη στήλη που χρησιμοποιείται για τον διαμερισμό δεδομένων. Μπορείτε να κάνετε διαμερισμό σε σχέση με τη στήλη με ακέραιο ή τύπο δεδομένων ημερομηνίας/ημερομηνίας/ώρας.
Partition upper bound και Partitionμε κάτω όριο: Καθορίστε εάν θέλετε να φιλτράρετε με βάση τη στήλη διαμερίσματος για την ανάκτηση δεδομένων μόνο μεταξύ της κάτω και της επάνω περιοχής.

Κατά την εκτέλεση, η υπηρεσία αντικαθιστά ?AdfRangePartitionColumnName, ?AdfRangePartitionUpboundκαι ?AdfRangePartitionLowbound με το πραγματικό όνομα στήλης και τις περιοχές τιμών για κάθε διαμέρισμα και αποστέλλει στη Βάση δεδομένων Azure για PostgreSQL.
Για παράδειγμα, εάν η στήλη διαμερίσματος "ID" έχει οριστεί με το χαμηλότερο όριο ως 1 και το επάνω όριο ως 80, ενώ η παράλληλη αντιγραφή έχει οριστεί ως 4, η υπηρεσία ανακτά δεδομένα με 4 διαμερίσματα. Τα αναγνωριστικά τους κυμαίνονται μεταξύ [1,20], [21, 40], [41, 60], και [61, 80], αντίστοιχα.

Βέλτιστες πρακτικές για τη φόρτωση δεδομένων με επιλογή διαμερίσματος:

  • Επιλέξτε μια χαρακτηριστική στήλη ως στήλη διαμερίσματος (όπως πρωτεύον κλειδί ή μοναδικό κλειδί) για να αποφύγετε την αλλοιοποίηση των δεδομένων.
  • Εάν ο πίνακας έχει ενσωματωμένο διαμέρισμα, χρησιμοποιήστε την επιλογή διαμερίσματος "Φυσικά διαμερίσματα πίνακα" για καλύτερη απόδοση.

Σύνοψη πίνακα

Ο παρακάτω πίνακας περιέχει περισσότερες πληροφορίες σχετικά με τη δραστηριότητα αντιγραφής στη Βάση δεδομένων Azure για PostgreSQL.

Πληροφορίες προέλευσης

Όνομα Περιγραφή Τιμή Απαιτούμενο Ιδιότητα δέσμης ενεργειών JSON
σύνδεσης Η σύνδεσή σας με τον χώρο αποθήκευσης δεδομένων προέλευσης. < τη βάση δεδομένων Azure για > σύνδεσης PostgreSQL Ναι σύνδεση
τύπου σύνδεσης Ο τύπος σύνδεσης προέλευσης. Βάση δεδομένων Azure για PostgreSQL Ναι /
Χρήση ερωτημάτων Ο τρόπος ανάγνωσης δεδομένων. Εφαρμόστε Πίνακας για να διαβάσετε δεδομένα από τον καθορισμένο πίνακα ή εφαρμόστε ερωτημάτων για την ανάγνωση δεδομένων με χρήση ερωτημάτων. Πίνακας
ερωτημάτων
Ναι • typeProperties (στην περιοχή typeProperties ->source)
  -Σχήματος
  -τραπέζι
•ερώτηση
λήξη χρονικού ορίου ερωτήματος (λεπτά) Ο χρόνος αναμονής πριν από τον τερματισμό της προσπάθειας εκτέλεσης μιας εντολής και τη δημιουργία ενός σφάλματος, η προεπιλογή είναι 120 λεπτά. Εάν η παράμετρος έχει οριστεί για αυτήν την ιδιότητα, οι επιτρεπόμενες τιμές είναι χρονικό διάστημα, όπως "02:00:00" (120 λεπτά). Για περισσότερες πληροφορίες, ανατρέξτε στο θέμα CommandTimeout. χρονικό διάστημα Όχι queryTimeout
ονομάτων διαμερίσματος Η λίστα των φυσικών διαμερισμάτων που πρέπει να αντιγραφούν. Εάν χρησιμοποιείτε ένα ερώτημα για να ανακτήσετε τα δεδομένα προέλευσης, το αγκίστρι ?AdfTabularPartitionName στον όρο WHERE. < τα ονόματα διαμερίσματος > Όχι partitionNames
ονόματος στήλης διαμερίσματος Το όνομα της στήλης προέλευσης σε ακέραιο ή τύπο ημερομηνίας/ημερομηνίας/ώρας (int, smallint, bigint, date, timestamp without time zone, timestamp with time zone ή time without time zone) που θα χρησιμοποιηθεί από τον διαμερισμό περιοχής για παράλληλη αντιγραφή. Εάν δεν καθοριστεί, το πρωτεύον κλειδί του πίνακα εντοπίζεται αυτόματα και χρησιμοποιείται ως στήλη διαμερίσματος. < τα ονόματα των στηλών διαμερίσματος > Όχι partitionColumnName
partition με επάνω όριο Η μέγιστη τιμή της στήλης διαμερίσματος για την αντιγραφή δεδομένων. Εάν χρησιμοποιείτε ένα ερώτημα για να ανακτήσετε τα δεδομένα προέλευσης, το αγκίστρι ?AdfRangePartitionUpbound στον όρο WHERE. < το διαμερίσματός σας στην επάνω δεσμευμένη > Όχι partitionUpperBound
Partition με κάτω όριο Η ελάχιστη τιμή της στήλης διαμερίσματος για την αντιγραφή δεδομένων. Εάν χρησιμοποιείτε ένα ερώτημα για να ανακτήσετε τα δεδομένα προέλευσης, το αγκίστρι ?AdfRangePartitionLowbound στον όρο WHERE. < του διαμερίσματός σας > με κάτω όριο Όχι partitionLowerBound
πρόσθετου στηλών Προσθέστε επιπλέον στήλες δεδομένων για να αποθηκεύσετε τη σχετική διαδρομή ή τη στατική τιμή των αρχείων προέλευσης. Η παράσταση υποστηρίζεται για το τελευταίο. •Όνομα
•Τιμή
Όχι πρόσθετες στηλών:
•Όνομα
•τιμή

Πληροφορίες προορισμού

Όνομα Περιγραφή Τιμή Απαιτούμενο Ιδιότητα δέσμης ενεργειών JSON
σύνδεσης Η σύνδεσή σας με τον χώρο αποθήκευσης δεδομένων προορισμού. < τη βάση δεδομένων Azure για > σύνδεσης PostgreSQL Ναι σύνδεση
τύπου σύνδεσης Ο τύπος σύνδεσης προορισμού σας. Βάση δεδομένων Azure για PostgreSQL Ναι /
πίνακα Ο πίνακας δεδομένων προορισμού σας για την εγγραφή δεδομένων. < όνομα του πίνακα προορισμού σας > Ναι typeProperties (στην περιοχή typeProperties ->sink):
  -Σχήματος
  -τραπέζι
μεθόδου Εγγραφή Η μέθοδος που χρησιμοποιείται για την εγγραφή δεδομένων στη Βάση δεδομένων Azure για PostgreSQL. εντολής Αντιγραφή (προεπιλογή)
μαζικής εισαγωγής
Όχι writeMethod:
• CopyCommand
• Μαζική εισαγωγή
προ-αντιγραφής δέσμης ενεργειών Ένα ερώτημα SQL για την εκτέλεση της δραστηριότητας αντιγραφής πριν από την εγγραφή δεδομένων στη βάση δεδομένων Azure για PostgreSQL σε κάθε εκτέλεση. Μπορείτε να χρησιμοποιήσετε αυτήν την ιδιότητα για να εκκαθαρίσετε τα προφορτωμένα δεδομένα. < > δέσμης ενεργειών προ-αντιγραφής Όχι preCopyScript
Εγγραφή χρονικού ορίου δέσμης Ο χρόνος αναμονής για την ολοκλήρωση της λειτουργίας εισαγωγής δέσμης προτού λήξει. χρονικό διάστημα
(η προεπιλογή είναι 00:30:00 - 30 λεπτά)
Όχι writeBatchTimeout
Εγγραφή μεγέθους δέσμης Ο αριθμός των γραμμών που φορτώθηκαν στη βάση δεδομένων Azure για PostgreSQL ανά δέσμη. ακέραιος
(η προεπιλογή είναι 1.000.000)
Όχι writeBatchSize