กําหนดค่า Azure Cosmos DB สําหรับ NoSQL ในกิจกรรมการคัดลอก
บทความนี้สรุปวิธีการใช้กิจกรรมการคัดลอกในไปป์ไลน์ข้อมูลเพื่อคัดลอกข้อมูลจากและไปยัง Azure Cosmos DB for NoSQL
การกําหนดค่าที่ได้รับการสนับสนุน
สําหรับการกําหนดค่าของแต่ละแท็บภายใต้กิจกรรมการคัดลอก ให้ไปที่ส่วนต่อไปนี้ตามลําดับ
ทั่วไป
โปรดดูคําแนะนําการตั้งค่าทั่วไปเพื่อกําหนดค่าแท็บ การตั้งค่าทั่วไป
ทรัพยากร
คุณสมบัติต่อไปนี้ได้รับการสนับสนุนสําหรับ Azure Cosmos DB สําหรับ NoSQL ภายใต้ แท็บแหล่งข้อมูล ของกิจกรรมการคัดลอก
จําเป็นต้องมีคุณสมบัติสามประการต่อไปนี้:
- ชนิดของที่เก็บข้อมูล: เลือก ภายนอก
- เชื่อมต่อ: เลือก Azure Cosmos DB สําหรับการเชื่อมต่อ NoSQL จากรายการการเชื่อมต่อ ถ้าไม่มีการเชื่อมต่ออยู่ ให้สร้าง Azure Cosmos DB ใหม่สําหรับการเชื่อมต่อ NoSQL โดยการเลือกใหม่
- คอนเทนเนอร์: เลือกคอนเทนเนอร์ที่คุณต้องการใช้ เลือก แก้ไข เพื่อป้อนชื่อคอนเทนเนอร์ด้วยตนเอง
ภายใต้ ขั้นสูง คุณสามารถระบุเขตข้อมูลต่อไปนี้:
ใช้คิวรี: คุณสามารถเลือก ตาราง หรือ คิวรี เป็นคิวรีที่คุณใช้ได้ รายการต่อไปนี้อธิบายถึงการกําหนดค่าของแต่ละการตั้งค่า
ตาราง: อ่านข้อมูลจากตารางที่คุณระบุในตาราง
คิวรี: ระบุคิวรี Azure Cosmos DB เพื่ออ่านข้อมูล
ขนาดหน้า: จํานวนเอกสารต่อหน้าของผลลัพธ์คิวรี ค่าเริ่มต้นคือ "-1" ซึ่งหมายความว่าใช้ขนาดหน้าแบบไดนามิกด้านบริการสูงสุด 1000
ตรวจหาวันที่เวลา: จะตรวจหาวันที่เวลาจากค่าสตริงในเอกสารหรือไม่ ค่าที่อนุญาตคือ: true (ค่าเริ่มต้น) เท็จ
ภูมิภาคที่ต้องการ: รายการภูมิภาคที่ต้องการเชื่อมต่อเมื่อดึงข้อมูลจาก Azure Cosmos DB เลือกภูมิภาคที่ต้องการหนึ่งรายการจากรายการดรอปดาวน์หลังจากเลือกใหม่
คอลัมน์เพิ่มเติม: เพิ่มคอลัมน์ข้อมูลเพิ่มเติมเพื่อจัดเก็บเส้นทางสัมพัทธ์หรือค่าคงที่ของไฟล์ต้นฉบับ นิพจน์ได้รับการสนับสนุนสําหรับอย่างหลัง สําหรับข้อมูลเพิ่มเติม ให้ไปที่ เพิ่มคอลัมน์เพิ่มเติมในระหว่างการคัดลอก
ปลายทาง
คุณสมบัติต่อไปนี้ได้รับการสนับสนุนสําหรับ Azure Cosmos DB สําหรับ NoSQL ภายใต้ แท็บปลายทาง ของกิจกรรมการคัดลอก
จําเป็นต้องมีคุณสมบัติสามประการต่อไปนี้:
- ชนิดของที่เก็บข้อมูล: เลือก ภายนอก
- เชื่อมต่อ: เลือก Azure Cosmos DB สําหรับการเชื่อมต่อ NoSQL จากรายการการเชื่อมต่อ
- คอนเทนเนอร์: เลือก เรียกดู เพื่อเลือกไฟล์ที่คุณต้องการคัดลอก หรือกรอกเส้นทางด้วยตนเอง
ภายใต้ ขั้นสูง คุณสามารถระบุเขตข้อมูลต่อไปนี้:
ลักษณะการทํางานของการเขียน: กําหนดลักษณะการทํางานของการเขียนเมื่อปลายทางคือแฟ้มจากที่เก็บข้อมูลตามแฟ้ม คุณสามารถเลือกเพิ่มเนื้อหาแบบไดนามิก แทรก หรือ Upsert จากรายการดรอปดาวน์
เพิ่มเนื้อหาแบบไดนามิก: เปิดเพิ่ม บานหน้าต่างเนื้อหา แบบไดนามิก การดําเนินการนี้จะเปิดตัวสร้างนิพจน์ที่คุณสามารถสร้างนิพจน์จากตัวแปรระบบที่สนับสนุน ผลลัพธ์กิจกรรม ฟังก์ชัน และตัวแปรหรือพารามิเตอร์ที่ผู้ใช้ระบุ สําหรับข้อมูลเกี่ยวกับภาษาของนิพจน์ ให้ไปที่ นิพจน์และฟังก์ชัน
แทรก: เลือกตัวเลือกนี้หากข้อมูลต้นฉบับของคุณมีการแทรก
Upsert: ลักษณะการทํางานของ upsert คือการแทนที่เอกสาร ถ้าเอกสารที่มี ID เดียวกันมีอยู่แล้ว มิฉะนั้น ให้แทรกเอกสาร
เขียนการหมดเวลาของชุดงาน: เวลารอสําหรับการดําเนินการแทรกชุดงานให้เสร็จสมบูรณ์ก่อนที่จะหมดเวลา ค่าที่อนุญาตคือ
Timespan
ตัวอย่างคือ 00:30:00 (30 นาที)เขียนขนาดของชุดงาน: ระบุจํานวนแถวที่จะแทรกลงในตาราง SQL สําหรับแต่ละชุดงาน ค่าที่อนุญาตคือจํานวนเต็ม (จํานวนแถว) ตามค่าเริ่มต้น บริการจะกําหนดขนาดของชุดงานที่เหมาะสมแบบไดนามิกตามขนาดของแถว
การเชื่อมต่อพร้อมกันสูงสุด: ขีดจํากัดสูงสุดของการเชื่อมต่อพร้อมกันที่สร้างไปยังที่เก็บข้อมูลในระหว่างการเรียกใช้กิจกรรม ระบุค่าเมื่อคุณต้องการจํากัดการเชื่อมต่อที่เกิดขึ้นพร้อมกันเท่านั้น
ปิดใช้งานการวิเคราะห์เมตริกประสิทธิภาพ: การตั้งค่านี้จะควบคุมคอลเลกชันของเมตริก เช่น DTU, DWU, RU และอื่นๆ สําหรับการคัดลอกการเพิ่มประสิทธิภาพและคําแนะนํา หากคุณกังวลเกี่ยวกับลักษณะการทํางานนี้ ให้ปิดคุณลักษณะนี้
การแม็ป
สําหรับการกําหนดค่าแท็บ การแมป ไปที่ กําหนดค่าการแมปของคุณ ภายใต้แท็บ การแมป
การตั้งค่า
สําหรับการกําหนดค่าแท็บการตั้งค่า ให้ไปที่ กําหนดการตั้งค่าอื่น ๆ ของคุณภายใต้แท็บ การตั้งค่า
ข้อมูลสรุปของตาราง
ตารางต่อไปนี้ประกอบด้วยข้อมูลเพิ่มเติมเกี่ยวกับกิจกรรมการคัดลอกใน Azure Cosmos DB สําหรับ NoSQL
ตารางต้นทาง
ชื่อ | รายละเอียด | ค่า | ต้องมี | คุณสมบัติสคริปต์ JSON |
---|---|---|---|---|
ชนิดของที่เก็บข้อมูล | ประเภทที่เก็บข้อมูลของคุณ | ภายนอก | ใช่ | / |
เชื่อมต่อชั่น | การเชื่อมต่อของคุณไปยังที่เก็บข้อมูลต้นทาง | <การเชื่อมต่อของคุณ> | ใช่ | เชื่อม ต่อ |
คอนเทนเนอร์ | ที่เก็บข้อมูลต้นทางของคุณ | <คอนเทนเนอร์ของแหล่งข้อมูลของคุณ> | ใช่ | คอนเทนเนอร์ fileName |
ใช้คิวรี | คุณสามารถเลือก ตาราง หรือ คิวรี เป็นคิวรีที่ใช้ของคุณได้ | • โต๊ะ • แบบสอบถาม |
ไม่ | ชนิด |
ขนาดหน้า | จํานวนเอกสารต่อหน้าของผลลัพธ์แบบสอบถาม ค่าเริ่มต้นคือ "-1" ซึ่งหมายความว่าใช้ขนาดหน้าแบบไดนามิกด้านบริการสูงสุด 1000 | <ขนาดหน้าเพจของคุณ> | ไม่ | pageSize |
ลบวันที่เวลา | แฟ้มบนแหล่งข้อมูลจะถูกลบออกทันทีหลังจากถูกย้ายไปยังที่เก็บปลายทาง การลบไฟล์เป็นการลบต่อไฟล์ ดังนั้นเมื่อกิจกรรมการคัดลอกล้มเหลว คุณจะทราบว่าไฟล์บางไฟล์ถูกคัดลอกไปยังปลายทางแล้วและถูกลบออกจากต้นทางในขณะที่ไฟล์อื่นยังคงอยู่บนร้านค้าต้นทาง | เลือกหรือไม่เลือก | ไม่ | detectDatetime |
ภูมิภาคที่ต้องการ | รายการภูมิภาคที่ต้องการเชื่อมต่อเมื่อดึงข้อมูลจาก Azure Cosmos DB เลือกภูมิภาคที่ต้องการหนึ่งรายการจากรายการดรอปดาวน์หลังจากเลือกใหม่ | <ภูมิภาคที่คุณต้องการ> | ไม่ | preferredRegions |
คอลัมน์เพิ่มเติม | เพิ่มคอลัมน์ข้อมูลเพิ่มเติมเพื่อจัดเก็บเส้นทางสัมพัทธ์หรือค่าคงที่ของไฟล์ต้นฉบับ นิพจน์ได้รับการสนับสนุนสําหรับอย่างหลัง สําหรับข้อมูลเพิ่มเติม ให้ไปที่ เพิ่มคอลัมน์เพิ่มเติมในระหว่างการคัดลอก | <การเชื่อมต่อพร้อมกันสูงสุด> | ไม่ | additionalColumns |
ตารางปลายทาง
ชื่อ | รายละเอียด | ค่า | ต้องมี | คุณสมบัติสคริปต์ JSON |
---|---|---|---|---|
ชนิดของที่เก็บข้อมูล | ประเภทที่เก็บข้อมูลของคุณ | ภายนอก | ใช่ | / |
เชื่อมต่อชั่น | การเชื่อมต่อของคุณไปยังที่เก็บข้อมูลปลายทาง | <การเชื่อมต่อของคุณ> | ใช่ | เชื่อม ต่อ |
คอนเทนเนอร์ | คอนเทนเนอร์ของข้อมูลปลายทางของคุณ | <คอนเทนเนอร์ของแหล่งที่มา> | ใช่ | คอนเทนเนอร์ fileName |
ลักษณะการทํางานของการเขียน | อธิบายวิธีการเขียนข้อมูลไปยัง Azure Cosmos DB ค่าที่อนุญาต: แทรกและ upsert ลักษณะการทํางานของ upsert คือการแทนที่เอกสารถ้าเอกสารที่มี ID เดียวกันมีอยู่แล้ว มิฉะนั้น ให้แทรกเอกสาร | • เพิ่มเนื้อหาแบบไดนามิก • ใส่ • Upsert |
ไม่ | writeBehavior |
เขียนการหมดเวลาของชุดงาน | เวลารอสําหรับการดําเนินการแทรกชุดงานให้เสร็จสมบูรณ์ก่อนที่จะหมดเวลา ค่าที่อนุญาตคือ Timespan ตัวอย่างคือ 00:30:00 (30 นาที) | timespan | ไม่ | writeBatchTimeout |
เขียนขนาดของชุดงาน | จํานวนแถวที่จะแทรกลงในตาราง SQL ต่อชุดงาน ค่าที่อนุญาตคือจํานวนเต็ม (จํานวนแถว) ตามค่าเริ่มต้น บริการจะกําหนดขนาดของชุดงานที่เหมาะสมแบบไดนามิกตามขนาดของแถว | <จํานวนแถว > (จํานวนเต็ม) |
ไม่ | writeBatchSize |
การเชื่อมต่อพร้อมกันสูงสุด | ขีดจํากัดสูงสุดของการเชื่อมต่อพร้อมกันที่สร้างขึ้นกับที่เก็บข้อมูลในระหว่างการเรียกใช้กิจกรรม ระบุค่าเมื่อคุณต้องการจํากัดการเชื่อมต่อที่เกิดขึ้นพร้อมกันเท่านั้น | <การเชื่อมต่อพร้อมกันสูงสุด> | ไม่ | maxConcurrent เชื่อมต่อ ions |
ปิดใช้งานการวิเคราะห์เมตริกประสิทธิภาพ | การตั้งค่านี้จะควบคุมคอลเลกชันของเมตริก เช่น DTU, DWU, RU และอื่นๆ สําหรับการคัดลอกการปรับประสิทธิภาพให้เหมาะสมและคําแนะนํา หากคุณกังวลเกี่ยวกับลักษณะการทํางานนี้ ให้ปิดคุณลักษณะนี้ | เลือกหรือไม่เลือก | ไม่ | disableMetricsCollection |