แชร์ผ่าน


กําหนดค่า Azure Cosmos DB สําหรับ NoSQL ในกิจกรรมการคัดลอก

บทความนี้สรุปวิธีการใช้กิจกรรมการคัดลอกในไปป์ไลน์ข้อมูลเพื่อคัดลอกข้อมูลจากและไปยัง Azure Cosmos DB for NoSQL

การกําหนดค่าที่ได้รับการสนับสนุน

สําหรับการกําหนดค่าของแต่ละแท็บภายใต้กิจกรรมการคัดลอก ให้ไปที่ส่วนต่อไปนี้ตามลําดับ

ทั่วไป

โปรดดูคําแนะนําการตั้งค่าทั่วไปเพื่อกําหนดค่าแท็บ การตั้งค่าทั่วไป

ทรัพยากร

คุณสมบัติต่อไปนี้ได้รับการสนับสนุนสําหรับ Azure Cosmos DB สําหรับ NoSQL ภายใต้ แท็บแหล่งข้อมูล ของกิจกรรมการคัดลอก

Screenshot showing source tab.

จําเป็นต้องมีคุณสมบัติสามประการต่อไปนี้:

  • ชนิดของที่เก็บข้อมูล: เลือก ภายนอก
  • เชื่อมต่อ: เลือก Azure Cosmos DB สําหรับการเชื่อมต่อ NoSQL จากรายการการเชื่อมต่อ ถ้าไม่มีการเชื่อมต่ออยู่ ให้สร้าง Azure Cosmos DB ใหม่สําหรับการเชื่อมต่อ NoSQL โดยการเลือกใหม่
  • คอนเทนเนอร์: เลือกคอนเทนเนอร์ที่คุณต้องการใช้ เลือก แก้ไข เพื่อป้อนชื่อคอนเทนเนอร์ด้วยตนเอง

ภายใต้ ขั้นสูง คุณสามารถระบุเขตข้อมูลต่อไปนี้:

  • ใช้คิวรี: คุณสามารถเลือก ตาราง หรือ คิวรี เป็นคิวรีที่คุณใช้ได้ รายการต่อไปนี้อธิบายถึงการกําหนดค่าของแต่ละการตั้งค่า

    • ตาราง: อ่านข้อมูลจากตารางที่คุณระบุในตาราง

    • คิวรี: ระบุคิวรี Azure Cosmos DB เพื่ออ่านข้อมูล

      Screenshot showing query.

  • ขนาดหน้า: จํานวนเอกสารต่อหน้าของผลลัพธ์คิวรี ค่าเริ่มต้นคือ "-1" ซึ่งหมายความว่าใช้ขนาดหน้าแบบไดนามิกด้านบริการสูงสุด 1000

  • ตรวจหาวันที่เวลา: จะตรวจหาวันที่เวลาจากค่าสตริงในเอกสารหรือไม่ ค่าที่อนุญาตคือ: true (ค่าเริ่มต้น) เท็จ

  • ภูมิภาคที่ต้องการ: รายการภูมิภาคที่ต้องการเชื่อมต่อเมื่อดึงข้อมูลจาก Azure Cosmos DB เลือกภูมิภาคที่ต้องการหนึ่งรายการจากรายการดรอปดาวน์หลังจากเลือกใหม่

    Screenshot showing preferred regions.

  • คอลัมน์เพิ่มเติม: เพิ่มคอลัมน์ข้อมูลเพิ่มเติมเพื่อจัดเก็บเส้นทางสัมพัทธ์หรือค่าคงที่ของไฟล์ต้นฉบับ นิพจน์ได้รับการสนับสนุนสําหรับอย่างหลัง สําหรับข้อมูลเพิ่มเติม ให้ไปที่ เพิ่มคอลัมน์เพิ่มเติมในระหว่างการคัดลอก

    Screenshot showing additional columns.

ปลายทาง

คุณสมบัติต่อไปนี้ได้รับการสนับสนุนสําหรับ Azure Cosmos DB สําหรับ NoSQL ภายใต้ แท็บปลายทาง ของกิจกรรมการคัดลอก

Screenshot showing destination tab.

จําเป็นต้องมีคุณสมบัติสามประการต่อไปนี้:

  • ชนิดของที่เก็บข้อมูล: เลือก ภายนอก
  • เชื่อมต่อ: เลือก Azure Cosmos DB สําหรับการเชื่อมต่อ NoSQL จากรายการการเชื่อมต่อ
  • คอนเทนเนอร์: เลือก เรียกดู เพื่อเลือกไฟล์ที่คุณต้องการคัดลอก หรือกรอกเส้นทางด้วยตนเอง

ภายใต้ ขั้นสูง คุณสามารถระบุเขตข้อมูลต่อไปนี้:

  • ลักษณะการทํางานของการเขียน: กําหนดลักษณะการทํางานของการเขียนเมื่อปลายทางคือแฟ้มจากที่เก็บข้อมูลตามแฟ้ม คุณสามารถเลือกเพิ่มเนื้อหาแบบไดนามิก แทรก หรือ Upsert จากรายการดรอปดาวน์

    • เพิ่มเนื้อหาแบบไดนามิก: เปิดเพิ่ม บานหน้าต่างเนื้อหา แบบไดนามิก การดําเนินการนี้จะเปิดตัวสร้างนิพจน์ที่คุณสามารถสร้างนิพจน์จากตัวแปรระบบที่สนับสนุน ผลลัพธ์กิจกรรม ฟังก์ชัน และตัวแปรหรือพารามิเตอร์ที่ผู้ใช้ระบุ สําหรับข้อมูลเกี่ยวกับภาษาของนิพจน์ ให้ไปที่ นิพจน์และฟังก์ชัน

    • แทรก: เลือกตัวเลือกนี้หากข้อมูลต้นฉบับของคุณมีการแทรก

    • Upsert: ลักษณะการทํางานของ upsert คือการแทนที่เอกสาร ถ้าเอกสารที่มี ID เดียวกันมีอยู่แล้ว มิฉะนั้น ให้แทรกเอกสาร

      Screenshot showing write behavior.

  • เขียนการหมดเวลาของชุดงาน: เวลารอสําหรับการดําเนินการแทรกชุดงานให้เสร็จสมบูรณ์ก่อนที่จะหมดเวลา ค่าที่อนุญาตคือTimespan ตัวอย่างคือ 00:30:00 (30 นาที)

  • เขียนขนาดของชุดงาน: ระบุจํานวนแถวที่จะแทรกลงในตาราง SQL สําหรับแต่ละชุดงาน ค่าที่อนุญาตคือจํานวนเต็ม (จํานวนแถว) ตามค่าเริ่มต้น บริการจะกําหนดขนาดของชุดงานที่เหมาะสมแบบไดนามิกตามขนาดของแถว

  • การเชื่อมต่อพร้อมกันสูงสุด: ขีดจํากัดสูงสุดของการเชื่อมต่อพร้อมกันที่สร้างไปยังที่เก็บข้อมูลในระหว่างการเรียกใช้กิจกรรม ระบุค่าเมื่อคุณต้องการจํากัดการเชื่อมต่อที่เกิดขึ้นพร้อมกันเท่านั้น

  • ปิดใช้งานการวิเคราะห์เมตริกประสิทธิภาพ: การตั้งค่านี้จะควบคุมคอลเลกชันของเมตริก เช่น DTU, DWU, RU และอื่นๆ สําหรับการคัดลอกการเพิ่มประสิทธิภาพและคําแนะนํา หากคุณกังวลเกี่ยวกับลักษณะการทํางานนี้ ให้ปิดคุณลักษณะนี้

การแม็ป

สําหรับการกําหนดค่าแท็บ การแมป ไปที่ กําหนดค่าการแมปของคุณ ภายใต้แท็บ การแมป

การตั้งค่า

สําหรับการกําหนดค่าแท็บการตั้งค่า ให้ไปที่ กําหนดการตั้งค่าอื่น ๆ ของคุณภายใต้แท็บ การตั้งค่า

ข้อมูลสรุปของตาราง

ตารางต่อไปนี้ประกอบด้วยข้อมูลเพิ่มเติมเกี่ยวกับกิจกรรมการคัดลอกใน Azure Cosmos DB สําหรับ NoSQL

ตารางต้นทาง

ชื่อ รายละเอียด ค่า ต้องมี คุณสมบัติสคริปต์ JSON
ชนิดของที่เก็บข้อมูล ประเภทที่เก็บข้อมูลของคุณ ภายนอก ใช่ /
เชื่อมต่อชั่น การเชื่อมต่อของคุณไปยังที่เก็บข้อมูลต้นทาง <การเชื่อมต่อของคุณ> ใช่ เชื่อม ต่อ
คอนเทนเนอร์ ที่เก็บข้อมูลต้นทางของคุณ <คอนเทนเนอร์ของแหล่งข้อมูลของคุณ> ใช่ คอนเทนเนอร์
fileName
ใช้คิวรี คุณสามารถเลือก ตาราง หรือ คิวรี เป็นคิวรีที่ใช้ของคุณได้ โต๊ะ
แบบสอบถาม
ไม่ ชนิด
ขนาดหน้า จํานวนเอกสารต่อหน้าของผลลัพธ์แบบสอบถาม ค่าเริ่มต้นคือ "-1" ซึ่งหมายความว่าใช้ขนาดหน้าแบบไดนามิกด้านบริการสูงสุด 1000 <ขนาดหน้าเพจของคุณ> ไม่ pageSize
ลบวันที่เวลา แฟ้มบนแหล่งข้อมูลจะถูกลบออกทันทีหลังจากถูกย้ายไปยังที่เก็บปลายทาง การลบไฟล์เป็นการลบต่อไฟล์ ดังนั้นเมื่อกิจกรรมการคัดลอกล้มเหลว คุณจะทราบว่าไฟล์บางไฟล์ถูกคัดลอกไปยังปลายทางแล้วและถูกลบออกจากต้นทางในขณะที่ไฟล์อื่นยังคงอยู่บนร้านค้าต้นทาง เลือกหรือไม่เลือก ไม่ detectDatetime
ภูมิภาคที่ต้องการ รายการภูมิภาคที่ต้องการเชื่อมต่อเมื่อดึงข้อมูลจาก Azure Cosmos DB เลือกภูมิภาคที่ต้องการหนึ่งรายการจากรายการดรอปดาวน์หลังจากเลือกใหม่ <ภูมิภาคที่คุณต้องการ> ไม่ preferredRegions
คอลัมน์เพิ่มเติม เพิ่มคอลัมน์ข้อมูลเพิ่มเติมเพื่อจัดเก็บเส้นทางสัมพัทธ์หรือค่าคงที่ของไฟล์ต้นฉบับ นิพจน์ได้รับการสนับสนุนสําหรับอย่างหลัง สําหรับข้อมูลเพิ่มเติม ให้ไปที่ เพิ่มคอลัมน์เพิ่มเติมในระหว่างการคัดลอก <การเชื่อมต่อพร้อมกันสูงสุด> ไม่ additionalColumns

ตารางปลายทาง

ชื่อ รายละเอียด ค่า ต้องมี คุณสมบัติสคริปต์ JSON
ชนิดของที่เก็บข้อมูล ประเภทที่เก็บข้อมูลของคุณ ภายนอก ใช่ /
เชื่อมต่อชั่น การเชื่อมต่อของคุณไปยังที่เก็บข้อมูลปลายทาง <การเชื่อมต่อของคุณ> ใช่ เชื่อม ต่อ
คอนเทนเนอร์ คอนเทนเนอร์ของข้อมูลปลายทางของคุณ <คอนเทนเนอร์ของแหล่งที่มา> ใช่ คอนเทนเนอร์
fileName
ลักษณะการทํางานของการเขียน อธิบายวิธีการเขียนข้อมูลไปยัง Azure Cosmos DB ค่าที่อนุญาต: แทรกและ upsert ลักษณะการทํางานของ upsert คือการแทนที่เอกสารถ้าเอกสารที่มี ID เดียวกันมีอยู่แล้ว มิฉะนั้น ให้แทรกเอกสาร เพิ่มเนื้อหาแบบไดนามิก
ใส่
Upsert
ไม่ writeBehavior
เขียนการหมดเวลาของชุดงาน เวลารอสําหรับการดําเนินการแทรกชุดงานให้เสร็จสมบูรณ์ก่อนที่จะหมดเวลา ค่าที่อนุญาตคือ Timespan ตัวอย่างคือ 00:30:00 (30 นาที) timespan ไม่ writeBatchTimeout
เขียนขนาดของชุดงาน จํานวนแถวที่จะแทรกลงในตาราง SQL ต่อชุดงาน ค่าที่อนุญาตคือจํานวนเต็ม (จํานวนแถว) ตามค่าเริ่มต้น บริการจะกําหนดขนาดของชุดงานที่เหมาะสมแบบไดนามิกตามขนาดของแถว <จํานวนแถว >
(จํานวนเต็ม)
ไม่ writeBatchSize
การเชื่อมต่อพร้อมกันสูงสุด ขีดจํากัดสูงสุดของการเชื่อมต่อพร้อมกันที่สร้างขึ้นกับที่เก็บข้อมูลในระหว่างการเรียกใช้กิจกรรม ระบุค่าเมื่อคุณต้องการจํากัดการเชื่อมต่อที่เกิดขึ้นพร้อมกันเท่านั้น <การเชื่อมต่อพร้อมกันสูงสุด> ไม่ maxConcurrent เชื่อมต่อ ions
ปิดใช้งานการวิเคราะห์เมตริกประสิทธิภาพ การตั้งค่านี้จะควบคุมคอลเลกชันของเมตริก เช่น DTU, DWU, RU และอื่นๆ สําหรับการคัดลอกการปรับประสิทธิภาพให้เหมาะสมและคําแนะนํา หากคุณกังวลเกี่ยวกับลักษณะการทํางานนี้ ให้ปิดคุณลักษณะนี้ เลือกหรือไม่เลือก ไม่ disableMetricsCollection