กําหนดค่า Azure Cosmos DB สําหรับ MongoDB ในกิจกรรมการคัดลอก
บทความนี้สรุปวิธีการใช้กิจกรรมการคัดลอกในไปป์ไลน์ข้อมูลเพื่อคัดลอกข้อมูลจากและไปยัง Azure Cosmos DB for MongoDB
การกําหนดค่าที่ได้รับการสนับสนุน
สําหรับการกําหนดค่าของแต่ละแท็บภายใต้กิจกรรมการคัดลอก ให้ไปที่ส่วนต่อไปนี้ตามลําดับ
ทั่วไป
โปรดดูคําแนะนําการตั้งค่าทั่วไปเพื่อกําหนดค่าแท็บ การตั้งค่าทั่วไป
แหล่งที่มา
ไปที่ แท็บแหล่งที่มา เพื่อกําหนดค่าแหล่งข้อมูลกิจกรรมการคัดลอกของคุณ ดูเนื้อหาต่อไปนี้สําหรับการกําหนดค่าโดยละเอียด
จําเป็นต้องมีคุณสมบัติต่อไปนี้:
- เชื่อมต่อ: เลือก Azure Cosmos DB สําหรับการเชื่อมต่อ MongoDB จากรายการการเชื่อมต่อ ถ้าไม่มีการเชื่อมต่ออยู่ ให้สร้าง Azure Cosmos DB ใหม่สําหรับการเชื่อมต่อ MongoDB โดยการเลือก เพิ่มเติม ที่ด้านล่างของรายการการเชื่อมต่อ
- ฐานข้อมูล: เลือกฐานข้อมูลของคุณจากรายการดรอปดาวน์
- ชื่อคอลเลกชัน: ระบุชื่อของคอลเลกชัน Azure Cosmos DB คุณสามารถเลือกคอลเลกชันจากรายการดรอปดาวน์
ภายใต้ ขั้นสูง คุณสามารถระบุเขตข้อมูลต่อไปนี้:
- ตัวกรอง: ระบุตัวกรองการเลือกโดยใช้ตัวดําเนินการคิวรี หากต้องการแสดงเอกสารทั้งหมดในคอลเลกชัน ให้ละเว้นพารามิเตอร์นี้หรือส่งผ่านเอกสารเปล่า ({})
- วิธีการเคอร์เซอร์: เลือก + ใหม่ เพื่อระบุวิธีดําเนินการคิวรีต้นแบบ วิธีในการดําเนินการคิวรีคือ:
- project: ระบุเขตข้อมูลที่จะส่งกลับในเอกสารสําหรับการคาดการณ์ หากต้องการแสดงเขตข้อมูลทั้งหมดในเอกสารที่ตรงกัน ให้ละเว้นพารามิเตอร์นี้
- sort: ระบุลําดับที่คิวรีจะส่งกลับเอกสารที่ตรงกัน สําหรับข้อมูลเพิ่มเติม ให้ไปที่ cursor.sort()
- limit: ระบุจํานวนสูงสุดของเอกสารที่เซิร์ฟเวอร์ส่งกลับ สําหรับข้อมูลเพิ่มเติม ให้ไปที่ cursor.limit()
- ข้าม: ระบุจํานวนเอกสารที่จะข้ามและจากจุดที่ MongoDB เริ่มต้นการแสดงผลลัพธ์ สําหรับข้อมูลเพิ่มเติม ให้ไปที่ cursor.skip()
- ขนาดของชุดงาน: ระบุจํานวนเอกสารที่จะส่งคืนในแต่ละชุดงานของการตอบสนองจากอินสแตนซ์ MongoDB ในกรณีส่วนใหญ่ การปรับเปลี่ยนขนาดของชุดงานจะไม่ส่งผลกระทบต่อผู้ใช้หรือแอพลิเคชัน Azure Cosmos DB จํากัดแต่ละชุดงานต้องไม่เกิน 40 เมกะไบต์ ขนาด ซึ่งเป็นผลรวมของจํานวนขนาดของชุดงานของขนาดเอกสาร ดังนั้นให้ลดค่านี้หากขนาดของเอกสารของคุณมีขนาดใหญ่ ค่าเริ่มต้นคือ 100 คุณสามารถเปลี่ยนค่าเริ่มต้นนี้ได้หากคุณมีความขัดแย้งในพอร์ต
- คอลัมน์เพิ่มเติม: เพิ่มคอลัมน์ข้อมูลเพิ่มเติมเพื่อจัดเก็บเส้นทางสัมพัทธ์หรือค่าคงที่ของไฟล์ต้นฉบับ นิพจน์ได้รับการสนับสนุนสําหรับอย่างหลัง
ปลายทาง
ไปที่ แท็บปลายทาง เพื่อกําหนดค่าปลายทางกิจกรรมการคัดลอกของคุณ ดูเนื้อหาต่อไปนี้สําหรับการกําหนดค่าโดยละเอียด
จําเป็นต้องมีคุณสมบัติต่อไปนี้:
- เชื่อมต่อ: เลือก Azure Cosmos DB สําหรับการเชื่อมต่อ MongoDB จากรายการการเชื่อมต่อ ถ้าไม่มีการเชื่อมต่ออยู่ ให้สร้าง Azure Cosmos DB ใหม่สําหรับการเชื่อมต่อ MongoDB โดยการเลือก เพิ่มเติม ที่ด้านล่างของรายการการเชื่อมต่อ
- ฐานข้อมูล: เลือกฐานข้อมูลของคุณจากรายการดรอปดาวน์
- ชื่อคอลเลกชัน: ระบุชื่อของคอลเลกชัน Azure Cosmos DB คุณสามารถเลือกคอลเลกชันจากรายการดรอปดาวน์
ภายใต้ ขั้นสูง คุณสามารถระบุเขตข้อมูลต่อไปนี้:
เขียนลักษณะการทํางาน: อธิบายวิธีการเขียนข้อมูลไปยัง Azure Cosmos DB สําหรับ MongoDB ค่าที่อนุญาต: แทรกและ Upsert
ลักษณะการทํางานของ Upsert คือการแทนที่เอกสารถ้าเอกสารที่มีเอกสารเดียวกัน
_id
มีอยู่แล้ว มิฉะนั้น ให้แทรกเอกสารหมายเหตุ
บริการจะสร้าง
_id
สําหรับเอกสารโดยอัตโนมัติถ้า_id
ไม่ได้ระบุ ในเอกสารต้นฉบับหรือโดยการแมปคอลัมน์ ซึ่งหมายความว่า คุณต้องตรวจสอบให้แน่ใจว่า Upsert ทํางานตามที่คาดไว้ เอกสารของคุณมี IDเขียนการหมดเวลาของชุดงาน: ระบุเวลารอสําหรับการดําเนินการแทรกชุดงานเพื่อเสร็จสิ้นก่อนที่จะหมดเวลา ค่าที่อนุญาตคือช่วงเวลาและค่าเริ่มต้นคือ 00:30:00 (30 นาที)
เขียนขนาดของชุดงาน: คุณสมบัตินี้จะควบคุมขนาดของเอกสารที่จะเขียนในแต่ละชุดงาน คุณสามารถลองเพิ่มค่าเพื่อปรับปรุงประสิทธิภาพและลดค่าถ้าขนาดเอกสารของคุณมีขนาดใหญ่ ค่าเริ่มต้นคือ 10,000
การแม็ป
สําหรับ การกําหนดค่าแท็บการแมป ดู กําหนดค่าการแมปของคุณภายใต้แท็บการแมป การแมปไม่ได้รับการสนับสนุนเมื่อทั้งต้นทางและปลายทางเป็นข้อมูลแบบลําดับชั้น
การตั้งค่า
สําหรับการตั้งค่าการกําหนดค่าแท็บ ให้ไปที่ กําหนดค่าการตั้งค่าอื่น ๆ ของคุณภายใต้แท็บ การตั้งค่า
ข้อมูลสรุปของตาราง
ตารางต่อไปนี้ประกอบด้วยข้อมูลเพิ่มเติมเกี่ยวกับกิจกรรมการคัดลอกใน Azure Cosmos DB สําหรับ MongoDB
ข้อมูลต้นทาง
ชื่อ | รายละเอียด | ค่า | ต้องมี | คุณสมบัติสคริปต์ JSON |
---|---|---|---|---|
เชื่อมต่อชั่น | การเชื่อมต่อของคุณไปยังที่เก็บข้อมูลต้นทาง | < Azure Cosmos DB ของคุณสําหรับการเชื่อมต่อ MongoDB > | ใช่ | เชื่อม ต่อ |
ฐานข้อมูล | ฐานข้อมูลของคุณที่คุณใช้เป็นแหล่งข้อมูล | < ฐานข้อมูลของคุณ > | ใช่ | ฐานข้อมูล |
ชื่อคอลเลกชัน | ชื่อของคอลเลกชัน Azure Cosmos DB | < คอลเลกชันของคุณ > | ใช่ | คอ ลเลก ชัน |
ตัวกรอง | ตัวกรองการเลือกโดยใช้ตัวดําเนินการคิวรี หากต้องการแสดงเอกสารทั้งหมดในคอลเลกชัน ให้ละเว้นพารามิเตอร์นี้หรือส่งผ่านเอกสารเปล่า ({}) | < ตัวกรองการเลือกของคุณ > | ไม่ | ตัวกรอง |
วิธีการเคอร์เซอร์ | วิธีดําเนินการคิวรีต้นแบบ | • โครงการ • เรียงลําดับ • ขีดจํากัด • ข้าม |
ไม่ | cursorMethods: •โครงการ •เรียง ลำดับ •จำกัด •ข้าม |
ขนาดของชุดงาน | จํานวนเอกสารที่จะส่งคืนในแต่ละชุดการตอบสนองจากอินสแตนซ์ MongoDB ในกรณีส่วนใหญ่ การปรับเปลี่ยนขนาดของชุดงานจะไม่ส่งผลกระทบต่อผู้ใช้หรือแอพลิเคชัน Azure Cosmos DB จํากัดแต่ละชุดงานต้องไม่เกิน 40 เมกะไบต์ ขนาด ซึ่งเป็นผลรวมของจํานวนขนาดของชุดงานของขนาดเอกสาร ดังนั้นให้ลดค่านี้หากขนาดของเอกสารของคุณมีขนาดใหญ่ | < เขียนขนาดของชุดงานของคุณ > (ค่าเริ่มต้นคือ 100) |
ไม่ | ขนาดชุด |
คอลัมน์เพิ่มเติม | เพิ่มคอลัมน์ข้อมูลเพิ่มเติมเพื่อจัดเก็บเส้นทางสัมพัทธ์หรือค่าคงที่ของไฟล์ต้นฉบับ นิพจน์ได้รับการสนับสนุนสําหรับอย่างหลัง | • ชื่อ •ค่า |
ไม่ | additionalColumns: •ชื่อ •ค่า |
ข้อมูลปลายทาง
ชื่อ | รายละเอียด | ค่า | ต้องมี | คุณสมบัติสคริปต์ JSON |
---|---|---|---|---|
เชื่อมต่อชั่น | การเชื่อมต่อของคุณไปยังที่เก็บข้อมูลปลายทาง | < Azure Cosmos DB ของคุณสําหรับการเชื่อมต่อ MongoDB > | ใช่ | เชื่อม ต่อ |
ฐานข้อมูล | ฐานข้อมูลของคุณที่คุณใช้เป็นปลายทาง | < ฐานข้อมูลของคุณ > | ใช่ | ฐานข้อมูล |
ชื่อคอลเลกชัน | ชื่อของคอลเลกชัน Azure Cosmos DB | < คอลเลกชันของคุณ > | ใช่ | คอ ลเลก ชัน |
ลักษณะการทํางานของการเขียน | อธิบายวิธีการเขียนข้อมูลไปยัง Azure Cosmos DB สําหรับ MongoDB ค่าที่อนุญาต: แทรกและ Upsert ลักษณะการทํางานของ Upsert คือการแทนที่เอกสารถ้าเอกสารที่มีเอกสารเดียวกัน _id มีอยู่แล้ว มิฉะนั้น ให้แทรกเอกสารหมายเหตุ: บริการจะสร้าง _id เอกสารโดยอัตโนมัติถ้า _id ไม่ได้ระบุ ในเอกสารต้นฉบับหรือโดยการแมปคอลัมน์ ซึ่งหมายความว่า คุณต้องตรวจสอบให้แน่ใจว่า Upsert ทํางานตามที่คาดไว้ เอกสารของคุณมี ID |
• แทรก (ค่าเริ่มต้น) • Upsert |
ไม่ | writeBehavior: •แทรก •upsert |
เขียนการหมดเวลาของชุดงาน | เวลารอสําหรับชุดงานที่แทรกการดําเนินงานเพื่อเสร็จสิ้นก่อนที่จะหมดเวลา | timespan (ค่าเริ่มต้นคือ 00:30:00 - 30 นาที) |
ไม่ | writeBatchTimeout |
เขียนขนาดของชุดงาน | ควบคุมขนาดของเอกสารที่จะเขียนในแต่ละชุดงาน คุณสามารถลองเพิ่มค่านี้เพื่อปรับปรุงประสิทธิภาพและลดค่าถ้าขนาดเอกสารของคุณมีขนาดใหญ่ | < เขียนขนาดของชุดงานของคุณ > (ค่าเริ่มต้นคือ 10,000) |
ไม่ | writeBatchSize |