Κοινή χρήση μέσω


Κατάργηση διπλοτύπων σε κάθε πίνακα για ενοποίηση δεδομένων

Η κατάργηση διπλότυπων δεδομένων εντοπίζει και καταργεί διπλότυπες καρτέλες για έναν πελάτη από έναν πίνακα προέλευσης, έτσι ώστε κάθε πελάτης να αντιπροσωπεύεται από μία γραμμή σε κάθε πίνακα. Σε κάθε πίνακα καταργούνται ξεχωριστά τα διπλότυπα χρησιμοποιώντας κανόνες για τον προσδιορισμό των καρτελών για έναν δεδομένο πελάτη.

Κάθε κανόνας κατάργησης διπλότυπων δεδομένων εκτελείται σε κάθε γραμμή. Εάν ο πρώτος κανόνας ταιριάζει με τις γραμμές 1 και 2 και ο κανόνας 2 ταιριάζει με τις γραμμές 2 και 3, τότε οι σειρές 1, 2 και 3 αντιστοιχίζονται. Όταν βρεθούν αντιστοιχισμένες γραμμές, επιλέγεται μια νικήτρια γραμμή για να αντιπροσωπεύσει αυτόν τον πελάτη με βάση τις προτιμήσεις συγχώνευσης (Πιο γεμάτες, Πιο πρόσφατες ή Λιγότερο πρόσφατες). Χρησιμοποιήστε την Προηγμένη επιλογή για να δημιουργήσετε μια νικήτρια γραμμή επιλέγοντας πεδία από τις διάφορες αντιστοιχισμένες γραμμές, όπως το πιο πρόσφατο μήνυμα ηλεκτρονικού ταχυδρομείου, αλλά την πιο συμπληρωμένη διεύθυνση.

Το Customer Insights - Data εκτελεί αυτόματα τις ακόλουθες ενέργειες:

  • Καταργήστε διπλότυπες εγγραφές με την ίδια τιμή πρωτεύοντος κλειδιού, επιλέγοντας την πρώτη γραμμή στο σύνολο δεδομένων ως νικήτρια.
  • Καταργήστε διπλότυπες καρτέλες χρησιμοποιώντας τους Αντιστοιχισμένους κανόνες που έχουν οριστεί για τον πίνακα κατά την αντιστοίχιση γραμμών μεταξύ πινάκων.

Καθορισμός κανόνων κατάργησης διπλοτύπων

Ένας καλός κανόνας προσδιορίζει έναν μοναδικό πελάτη. Λάβετε υπόψη τα δεδομένα σας. Ίσως να αρκεί ο προσδιορισμός πελατών βάσει ενός πεδίου όπως το ηλεκτρονικό ταχυδρομείο. Ωστόσο, εάν θέλετε να διαφοροποιήσετε τους πελάτες που χρησιμοποιούν από κοινού ένα μήνυμα ηλεκτρονικού ταχυδρομείου, μπορείτε να επιλέξετε να έχετε έναν κανόνα με δύο συνθήκες, που να αντιστοιχούν σε Email + Όνομα. Για περισσότερες πληροφορίες, ανατρέξτε στο Βέλτιστες πρακτικές κατάργησης διπλοτύπων.

  1. Στη σελίδα Κανόνες κατάργησης διπλοτύπων, επιλέξτε έναν πίνακα και επιλέξτε Προσθήκη κανόνα για να καθορίσετε τους κανόνες κατάργησης διπλοτύπων.

    Φιλοδώρημα

    Εάν έχετε εμπλουτίσει πίνακες σε επίπεδο προέλευσης δεδομένων για να βελτιώσετε τα αποτελέσματα ενοποίησης, επιλέξτε Χρήση εμπλουτισμένων πινάκων στην κορυφή της σελίδας. Για περισσότερες πληροφορίες δείτε το εμπλουτισμός για προελεύσεις δεδομένων.

    Στιγμιότυπο οθόνης της σελίδας Κανόνων κατάργησης διπλοτύπων με τον πίνακα επισημασμένο και την εμφάνιση κανόνα Προσθήκης

  2. Στο παράθυρο Προσθήκη κανόνα εισαγάγετε τις ακόλουθες πληροφορίες:

    • Επιλογή πεδίου: Επιλέξτε από τη λίστα των διαθέσιμων πεδίων από τον πίνακα που θέλετε να ελέγξετε για διπλότυπα. Επιλέξτε πεδία που είναι πιθανό να είναι μοναδικά για κάθε πελάτη. Για παράδειγμα, μια διεύθυνση ηλεκτρονικού ταχυδρομείου ή ο συνδυασμός ονόματος, πόλης και αριθμού τηλεφώνου.

      • Ομαλοποίηση: Κάντε μία από τις ακόλουθες επιλογές ομαλοποίησης για τη στήλη. Η κανονικοποίηση επηρεάζει μόνο το βήμα αντιστοίχισης και δεν αλλάζει τα δεδομένα.

        Κανονικοποίηση Παραδείγματα
        Αριθμοί Μετατρέπει πολλά σύμβολα Unicode που αντιπροσωπεύουν αριθμούς σε απλούς αριθμούς.
        Παραδείγματα: Το ❽ και το Ⅷ κανονικοποιούνται και τα δύο στον αριθμό 8.
        Σημείωση: Τα σύμβολα πρέπει να είναι κωδικοποιημένα σε μορφή Unicode Point.
        Σύμβολα Καταργεί τα σύμβολα και τους ειδικούς χαρακτήρες.
        Παραδείγματα: !?"#$%&'( )+,.-/:;<=>@^~{}`[ ]
        Κείμενο σε πεζά Μετατρέπει τους κεφαλαίους χαρακτήρες σε πεζούς. 
        Παράδειγμα: "ΑΥΤΟ ΕίΝαι έΝα παΡάδειγμΑ" μετατρέπεται σε "αυτό είναι ένα παράδειγμα"
        Τύπος - Τηλέφωνο Μετατρέπει τηλέφωνα σε διάφορες μορφές σε ψηφία και λαμβάνει υπόψη τις παραλλαγές στον τρόπο με τον οποίο παρουσιάζονται οι κωδικοί και οι επεκτάσεις χωρών. Τα σύμβολα και το κενό διάστημα παραβλέπονται. Τα αρχικά ψηφία «0» στους κωδικούς χωρών αγνοούνται, αντιστοιχίζοντας τα +1 και +01. Οι επεκτάσεις που υποδηλώνονται με πρόθεμα με γράμματα αγνοούνται (X 123). Ο κανονικοποιημένος κωδικός χώρας είναι σημαντικός, επομένως ένα τηλέφωνο με κωδικό χώρας δεν θα ταιριάζει με ένα τηλέφωνο χωρίς κωδικό χώρας.
        Παράδειγμα: Το +01 425.555.1212 ταιριάζει με το 1 (425) 555-1212
        Το +01 425.555.1212 δεν θα ταιριάζει με το (425) 555-1212
        Τύπος - Όνομα Μετατρέπει περισσότερες από 500 κοινές παραλλαγές ονομάτων και τίτλους. 
        Παραδείγματα: "debby" -> "deborah" "prof" και "professor" -> "Prof."
        Τύπος - Διεύθυνση Μετατρέπει κοινά μέρη διευθύνσεων
        Παραδείγματα: "street" -> "st" και "northwest" -> "nw"
        Τύπος - Οργανισμός Καταργεί περίπου 50 «λέξεις θορύβου» με το όνομα της εταιρείας όπως «co», «corp», «corporation» και «ltd».
        Unicode σε ASCII Μετατρέπει χαρακτήρες Unicode στους ισοδύναμους χαρακτήρες ASCII
        Παράδειγμα: Οι χαρακτήρες 'à,' 'á,' 'â,' 'À' 'Á,' 'Â,' 'Ã', 'Ä,' 'Ⓐ' και 'A' μετατρέπονται όλοι σε 'a .'
        Κενό διάστημα Καταργεί όλα τα κενά διαστήματα
        Αντιστοίχιση ψευδώνυμου Σας επιτρέπει να ανεβάσετε μια προσαρμοσμένη λίστα ζευγών συμβολοσειρών που στη συνέχεια μπορούν να χρησιμοποιηθούν για να υποδείξουν συμβολοσειρές που πρέπει πάντα να θεωρούνται ως ακριβής αντιστοίχιση. 
        Χρησιμοποιήστε τη χαρτογράφηση ψευδωνύμου όταν έχετε συγκεκριμένα παραδείγματα δεδομένων που πιστεύετε ότι πρέπει να ταιριάζουν και δεν αντιστοιχίζονται χρησιμοποιώντας ένα από τα άλλα μοτίβα κανονικοποίησης. 
        Παράδειγμα: Scott και Scooter ή MSFT και Microsoft.
        Προσαρμοσμένη παράκαμψη Σας επιτρέπει να ανεβάσετε μια προσαρμοσμένη λίστα συμβολοσειρών που στη συνέχεια μπορούν να χρησιμοποιηθούν για να υποδείξουν συμβολοσειρές που δεν πρέπει ποτέ να αντιστοιχιστούν.
        Η προσαρμοσμένη παράκαμψη είναι χρήσιμη όταν έχετε δεδομένα με κοινές τιμές που πρέπει να αγνοηθούν, όπως έναν εικονικό αριθμό τηλεφώνου ή ένα εικονικό μήνυμα ηλεκτρονικού ταχυδρομείου. 
        Παράδειγμα: Ποτέ μην ταιριάζει με το τηλέφωνο 555-1212, ή test@contoso.com
    • Ακρίβεια: Ορίζει το επίπεδο ακρίβειας. Η ακρίβεια χρησιμοποιείται για ακριβή αντιστοίχιση και ασαφή αντιστοίχιση και καθορίζει πόσο κοντά πρέπει να είναι δύο συμβολοσειρές για να θεωρηθούν ταίριασμα.

      • Βασικό: Επιλέξτε από Χαμηλή (30%), Μέση (60%), Υψηλή (80%) και Ακριβής (100%). Επιλέξτε Ακριβής για αντιστοίχιση μόνο με καρτέλες που συμφωνούν 100 τοις εκατό.
      • Προσαρμογή: Ορίστε ένα ποσοστό που θα πρέπει να ταιριάζει με τις καρτέλες. Το σύστημα θα ταιριάζει μόνο με καρτέλες που περνούν αυτό το όριο.
    • Όνομα: Όνομα για τον κανόνα.

      Στιγμιότυπο οθόνης του παραθύρου Προσθήκη κανόνα για κατάργηση διπλοτύπων.

  3. Προαιρετικά, επιλέξτε Προσθήκη>Προσθήκη συνθήκης για να προσθέσετε περισσότερες συνθήκες στον κανόνα. Οι συνθήκες συνδέονται με έναν λογικό τελεστή AND και επομένως εκτελούνται μόνο εάν πληρούνται όλες οι συνθήκες.

  4. Προαιρετικά, Προσθήκη>Προσθήκη εξαίρεσης για να προσθέσετε εξαιρέσεις στον κανόνα. Οι εξαιρέσεις χρησιμοποιούνται για την αντιμετώπιση σπάνιων περιπτώσεων ψευδών θετικών και ψευδών αρνητικών αποτελεσμάτων.

  5. Επιλέξτε Ολοκλήρωση για να δημιουργήσετε τον κανόνα.

  6. Προαιρετικά, προσθέστε περισσότερους κανόνες.

Επιλέξτε προτιμήσεις συγχώνευσης

Όταν εκτελούνται κανόνες και αναγνωρίζονται διπλότυπες καρτέλες για έναν πελάτη, επιλέγεται μια "νικήτρια σειρά" με βάση την πολιτική συγχώνευσης. Η νικήτρια γραμμή αντιπροσωπεύει τον πελάτη στο επόμενο βήμα ενοποίησης που αντιστοιχίζει καρτέλες μεταξύ πινάκων. Τα δεδομένα στις σειρές που δεν είναι νικητές ("εναλλακτικές") χρησιμοποιούνται στο βήμα ενοποίησης κανόνων αντιστοίχισης για την αντιστοίχιση καρτελών από άλλους πίνακες στη νικήτρια σειρά. Αυτή η προσέγγιση βελτιώνει τα αποτελέσματα αντιστοίχισης, επιτρέποντας σε πληροφορίες, όπως προηγούμενους αριθμούς τηλεφώνου, να βοηθούν στον εντοπισμό καρτελών που ταιριάζουν. Η νικήτρια σειρά μπορεί να ρυθμιστεί ώστε να είναι η πιο γεμάτη, η πιο πρόσφατη ή η λιγότερο πρόσφατη από τις διπλότυπες εγγραφές που βρέθηκαν.

  1. Επιλέξτε έναν πίνακα και, στη συνέχεια, Επεξεργασία προτιμήσεων συγχώνευσης. Εμφανίζεται το τμήμα παραθύρου Προτιμήσεις συγχώνευσης.

  2. Επιλέξτε μία από τις τρεις επιλογές για να καθορίσετε την καρτέλα που θα διατηρηθεί σε περίπτωση που βρεθεί διπλότυπο:

    • Οι πιο γεμάτες: προσδιορίζει την καρτέλα με τις πιο ενημερωμένες στήλες ως την καρτέλα του νικητή. Είναι η προεπιλεγμένη επιλογή συγχώνευσης.
    • Πιο πρόσφατη: προσδιορίζει την καρτέλα του νικητή με βάση τις πλέον πρόσφατες. Απαιτεί μια ημερομηνία ή ένα αριθμητικό πεδίο για τον καθορισμό του πρόσφατου χαρακτήρα.
    • Λιγότερο πρόσφατη: προσδιορίζει την καρτέλα του νικητή με βάση τις λιγότερο πρόσφατες. Απαιτεί μια ημερομηνία ή ένα αριθμητικό πεδίο για τον καθορισμό του πρόσφατου χαρακτήρα.

    Σε περίπτωση ισοπαλίας, η καρτέλα του νικητή είναι αυτή με το ΜΕΓΙΣΤΟ(PK) ή με τη μεγαλύτερη τιμή του πρωτεύοντος κλειδιού.

  3. Προαιρετικά, για να καθορίσετε τις προτιμήσεις συγχώνευσης σε μεμονωμένες στήλες ενός πίνακα, επιλέξτε Για προχωρημένους στο κάτω μέρος του παραθύρου. Για παράδειγμα, μπορείτε να επιλέξετε να διατηρήσετε την πιο πρόσφατη διεύθυνση ηλεκτρονικού ταχυδρομείου ΚΑΙ την πιο ολοκληρωμένη διεύθυνση από διαφορετικές καρτέλες. Αναπτύξτε τον πίνακα για να δείτε όλες τις στήλες του και να καθορίσετε την επιλογή που θα χρησιμοποιήσετε για μεμονωμένες στήλες. Εάν κάνετε μια επιλογή που βασίζεται σε επάρκεια, θα χρειαστεί επίσης να καθορίσετε ένα πεδίο ημερομηνίας/ώρας που καθορίζει την επάρκεια.

    Παράθυρο προτιμήσεων συγχώνευσης για προχωρημένους που δείχνει πρόσφατο email και την πλήρη διεύθυνση

  4. Επιλέξτε Ολοκλήρωση για να εφαρμοστούν προτιμήσεις συγχώνευσης.

Αφού καθορίσετε τους κανόνες κατάργησης διπλοτύπων και τις προτιμήσεις συγχώνευσης, επιλέξτε Επόμενο.