แชร์ผ่าน


ลบรายการที่ซ้ำกันในแต่ละตารางเพื่อการรวมข้อมูล

ขั้นตอนกฎการขจัดข้อมูลซ้ำซ้อนของการรวมจะค้นหาและลบเรกคอร์ดที่ซ้ำกันของลูกค้าออกจากตารางต้นทาง เพื่อให้ลูกค้าแต่ละรายแสดงด้วยแถวเดียวในแต่ละตาราง แต่ละตารางจะถูกขจัดข้อมูลซ้ำซ้อนแยกกันโดยใช้กฎ เพื่อระบุเรกคอร์ดสำหรับลูกค้าที่กำหนด

กฎได้รับการประมวลผลตามลำดับ หลังจากที่กฎทั้งหมดทำงานกับเรคคอร์ดทั้งหมดในตารางแล้ว กลุ่มการจับคู่ที่ใช้แถวร่วมกันจะถูกรวมเป็นกลุ่มการจับคู่เดียว

กำหนดกฎการลบข้อมูลซ้ำซ้อน

กฎที่ดีจะระบุถึงลูกค้าที่ไม่ซ้ำกัน พิจารณาข้อมูลของคุณ การระบุลูกค้าตามฟิลด์ เช่น อีเมล อาจเพียงพอแล้ว อย่างไรก็ตาม หากคุณต้องการแยกความแตกต่างระหว่างลูกค้าที่แชร์อีเมล คุณอาจเลือกที่จะมีกฎที่มีสองเงื่อนไข ซึ่งตรงกับอีเมล + ชื่อ สำหรับข้อมูลเพิ่มเติม โปรดดู แนวทางปฏิบัติการขจัดข้อมูลซ้ำซ้อน

  1. บนหน้า กฎการขจัดข้อมูลซ้ำซ้อน ให้เลือกตารางและเลือก เพิ่มกฎ เพื่อกำหนดกฎการลบข้อมูลซ้ำซ้อน

    เคล็ดลับ

    หากคุณเพิ่มตารางในระดับแหล่งข้อมูลเพื่อในการช่วยปรับปรุงผลลัพธ์การรวมของคุณ ให้เลือก ใช้ตารางที่เพิ่มข้อมูล ที่ด้านบนของหน้า สำหรับข้อมูลเพิ่มเติม โปรดดู การเพิ่มความสมบูรณ์จากแหล่งข้อมูล

    ภาพหน้าจอของหน้ากฎการขจัดข้อมูลซ้ำซ้อนที่เน้นตารางและแสดงเพิ่มกฎ

  2. ในบานหน้าต่าง เพิ่มกฎ ให้ป้อนข้อมูลดังต่อไปนี้:

    • เลือกฟิลด์: เลือกจากรายการฟิลด์ที่มีอยู่จากตารางที่คุณต้องการตรวจสอบรายการที่ซ้ำกัน เลือกฟิลด์ที่มีแนวโน้มไม่ซ้ำกันสำหรับลูกค้าหนึ่งราย ตัวอย่างเช่น ที่อยู่อีเมล หรือชื่อ เมือง และหมายเลขโทรศัพท์รวมกัน

      • ทำให้เป็นมาตรฐาน: เลือกจากตัวเลือกการทำให้เป็นมาตรฐานสำหรับคอลัมน์ การทำให้เป็นมาตรฐานจะส่งผลต่อขั้นตอนการจับคู่เท่านั้น และจะไม่เปลี่ยนแปลงข้อมูล

        การทำให้เป็นมาตรฐาน ตัวอย่าง
        ตัวเลข แปลงสัญลักษณ์ Unicode จำนวนมากที่แสดงตัวเลขเป็นตัวเลขอย่างง่าย
        ตัวอย่าง: ❽ และ Ⅷ ต่างก็ถูกทำให้เป็นตัวเลข 8
        หมายเหตุ: สัญลักษณ์จะต้องเข้ารหัสในรูปแบบ Unicode Point
        สัญลักษณ์ ลบสัญลักษณ์และอักขระพิเศษ
        ตัวอย่าง: !?"#$%&'( )+,.-/:;<=>@^~{}`[ ]
        ข้อความเป็นตัวพิมพ์เล็ก แปลงอักขระตัวพิมพ์ใหญ่เป็นตัวพิมพ์เล็ก 
        ตัวอย่าง: "THIS Is aN EXamplE" ถูกแปลงเป็น "this is an example"
        ชนิด – โทรศัพท์ แปลงโทรศัพท์ในรูปแบบต่างๆ ให้เป็นตัวเลข และคำนึงถึงรูปแบบต่างๆ ในการแสดงรหัสประเทศและหมายเลขต่อ สัญลักษณ์และช่องว่างจะถูกละเว้น ตัวเลขนำหน้า '0' ในรหัสประเทศจะถูกละเว้น โดยจะจับคู่ +1 และ +01 ส่วนขยายที่แสดงด้วยคำนำหน้าตัวอักษรจะถูกละเว้น (X 123) รหัสประเทศปกติมีความสำคัญ ดังนั้นโทรศัพท์ที่มีรหัสประเทศจะไม่ตรงกับโทรศัพท์ที่ไม่มีรหัสประเทศ
        ตัวอย่าง: +01 425.555.1212 ตรงกับ 1 (425) 555-1212
        +01 425.555.1212 ไม่ตรงกับ (425) 555-1212
        ชนิด - ชื่อ แปลงชื่อและชื่อเรื่องทั่วไปมากกว่า 500 รายการ 
        ตัวอย่าง: "debby" -> "deborah" "prof" and "professor" -> "Prof."
        ชนิด - ที่อยู่ แปลงส่วนทั่วไปของที่อยู่
        ตัวอย่าง: "street" -> "st" and "northwest" -> "nw"
        ชนิด - องค์กร ลบ "คำฟุ่มเฟือย" ของชื่อบริษัทประมาณ 50 ชื่อ เช่น "co," "corp," "corporation," และ "ltd."
        Unicode เป็น ASCII แปลงอักขระ Unicode เป็นตัวอักษรเทียบเท่ากับ ASCII
        ตัวอย่าง: อักขระ 'à,' 'á,' 'â,' 'À,' 'Á,' 'Â,' 'Ã,' 'Ä,' 'Ⓐ,' และ 'A' ทั้งหมดถูกแปลงเป็น 'a'
        ช่องว่าง ลบช่องว่างทั้งหมด
        การแมปนามแฝง ช่วยให้คุณสามารถอัปโหลดรายการคู่สตริงที่กำหนดเอง ซึ่งสามารถใช้เพื่อระบุสตริงที่ควรพิจารณาว่าเป็นการทำงานแบบตรงทั้งหมดเสมอ 
        ใช้การแมปนามแฝงเมื่อคุณมีตัวอย่างข้อมูลเฉพาะที่คุณคิดว่าควรตรงกันและไม่ตรงกัน โดยใช้รูปแบบการปรับมาตรฐานอย่างใดอย่างหนึ่ง 
        ตัวอย่าง: Scott และ Scooter หรือ MSFT และ Microsoft
        บายพาสแบบกําหนดเอง ช่วยให้คุณสามารถอัปโหลดรายการสตริงที่ ซึ่งสามารถใช้เพื่อระบุสตริงที่ไม่ควรตรงกัน
        การเลี่ยงผ่านแบบกำหนดเองมีประโยชน์เมื่อคุณมีข้อมูลที่มีค่าทั่วไปที่ควรละเว้น เช่น หมายเลขโทรศัพท์จำลองหรืออีเมลจำลอง 
        ตัวอย่าง: ไม่ตรงกับโทรศัพท์ 555-1212 หรือ test@contoso.com
    • ความแม่นยำ: ตั้งค่าระดับของความแม่นยำ ความแม่นยำใช้สำหรับการตรงกันทุกประการและการตรงกันบางส่วน และกำหนดว่าสองสตริงต้องใกล้เคียงกันแค่ไหนจึงจะถือว่าตรงกัน

      • พื้นฐาน: เลือกจาก ต่ำ (30%), ปานกลาง (60%), สูง (80%) และ ตรงกันทุกประการ (100%) เลือก ตรงกันทุกประการ เพื่อจับคู่เรกคอร์ดที่ตรงกัน 100 เปอร์เซ็นต์เท่านั้น
      • กำหนดเอง: กำหนดเปอร์เซ็นต์ที่เรกคอร์ดต้องตรงกัน ระบบจะจับคู่เรกคอร์ดที่ผ่านเกณฑ์นี้เท่านั้น
    • ชื่อ: ชื่อสำหรับกฎ

      ภาพหน้าจอของบานหน้าต่างเพิ่มกฎสำหรับการลบรายการที่ซ้ำกัน

  3. หรือ เลือก เพิ่ม>เพิ่มเงื่อนไข เพื่อเพิ่มเงื่อนไขเพิ่มเติมให้กับกฎ เงื่อนไขเชื่อมต่อกับตัวดำเนินการเชิงตรรกะ และจะมีการดำเนินการก็ต่อเมื่อตรงตามเงื่อนไขทั้งหมดเท่านั้น

  4. อีกทางหนึ่งคือ เพิ่ม>เพิ่มข้อยกเว้น เพื่อ เพิ่มข้อยกเว้นให้กับกฎ ข้อยกเว้นถูกใช้เพื่อจัดการกับกรณีที่เกิดขึ้นได้ยากของผลลัพธ์ที่ผิดและผลลบเท็จ

  5. เลือก เสร็จสิ้น เพื่อสร้างกฎ

  6. หรือ เพิ่มกฎเพิ่มเติม

เลือกการกำหนดลักษณะการผสานแทนที่

เมื่อมีการเรียกใช้กฎและมีการระบุเรกคอร์ดที่ซ้ำกันสำหรับลูกค้า จะมีการเลือก "แถวผู้ชนะ" ตามนโยบายการรวม แถวผู้ชนะแสดงถึงลูกค้าในขั้นตอนการรวมถัดไปที่ตรงกับเรกคอร์ดระหว่างตาราง ข้อมูลในแถวที่ไม่ใช่ผู้ชนะ ("สำรอง") จะใช้ในขั้นตอนการรวมกฎการจับคู่เพื่อจับคู่เรกคอร์ดจากตารางอื่นกับแถวผู้ชนะ วิธีการนี้ช่วยปรับปรุงผลลัพธ์ที่ตรงกันโดยอนุญาตให้ใช้ข้อมูล เช่น หมายเลขโทรศัพท์ก่อนหน้าเพื่อช่วยระบุเรกคอร์ดที่ตรงกัน แถวผู้ชนะสามารถกำหนดค่าให้เป็นเรกคอร์ดที่ซ้ำกันมากที่สุด ล่าสุด หรือล่าสุดน้อยที่สุดที่พบ

  1. เลือกตาราง จากนั้น แก้ไขการกําหนดลักษณะการรวมเข้าด้วยกัน บานหน้าต่าง การกําหนดลักษณะการรวม จะปรากฏขึ้น

  2. เลือกหนึ่งในสามตัวเลือกเพื่อกำหนดว่าจะเก็บบันทึกใดหากพบรายการที่ซ้ำกัน:

    • ที่กรอกข้อมูลมากที่สุด : ระบุเรกคอร์ดที่มีคอลัมน์ที่กรอกข้อมูลมากที่สุดเป็นเรกคอร์ดผู้ชนะ ซึ่งเป็นตัวเลือกการผสานเริ่มต้น
    • ล่าสุด: ระบุเรกคอร์ดผู้ชนะโดยพิจารณาจากความใหม่ที่สุด ต้องมีวันที่หรือฟิลด์ตัวเลขเพื่อกำหนดความใหม่
    • รายการที่เก่าที่สุด: ระบุเรกคอร์ดผู้ชนะโดยพิจารณาจากความใหม่น้อยที่สุด ต้องมีวันที่หรือฟิลด์ตัวเลขเพื่อกำหนดความใหม่

    หากเสมอกัน เรกคอร์ดผู้ชนะคือรายการที่มี MAX (PK) หรือค่าคีย์หลักที่มากกว่า

  3. หรือหากต้องการกำหนดการกําหนดลักษณะการรวมเข้าด้วยกันกับแต่ละคอลัมน์ของตาราง ให้เลือก ขั้นสูง ที่ด้านล่างของบานหน้าต่าง ตัวอย่างเช่น คุณสามารถเลือกเก็บอีเมลล่าสุดและที่อยู่ที่สมบูรณ์ที่สุดจากเรกคอร์ดต่างๆ ขยายตารางเพื่อดูคอลัมน์ทั้งหมดและกำหนดตัวเลือกที่จะใช้สำหรับแต่ละคอลัมน์ หากคุณเลือกตัวเลือกตามความใหม่ คุณต้องระบุฟิลด์วันที่/เวลาที่กำหนดความใหม่ด้วย

    บานหน้าต่างการกําหนดลักษณะการรวมเข้าด้วยกันขั้นสูงที่แสดงอีเมลล่าสุดและที่อยู่ที่สมบูรณ์

  4. เลือก เสร็จสิ้น เพื่อนำการกําหนดลักษณะการรวมเข้าด้วยกันของคุณมาใช้

หลังจากกำหนดกฎการลบข้อมูลซ้ำซ้อนและการกําหนดลักษณะการรวมเข้าด้วยกัน ให้เลือก ถัดไป