งานคัดลอก (ตัวอย่าง) ใน Data Factory สําหรับ Microsoft Fabric คืออะไร
Data Factory in Fabric ช่วยให้ผู้ใช้สามารถรวมข้อมูลจากตัวเชื่อมต่อที่มีอยู่ภายในกว่า 100 ตัวได้อย่างราบรื่น ทั้งต้นทางและปลายทาง ผ่านอินเทอร์เฟซที่ใช้งานง่าย กิจกรรมการคัดลอก การทํางานภายในไปป์ไลน์ข้อมูล ช่วยอํานวยความสะดวกในการนําเข้าข้อมูล ในขณะเดียวกัน Dataflow Gen2 สนับสนุนการแปลงข้อมูลและไปป์ไลน์ผสานโฟลว์ของการรวม
ข้อดีของงานคัดลอก
ในขณะที่กิจกรรมการคัดลอกภายในไปป์ไลน์ข้อมูลจัดการการนําเข้าข้อมูลด้วยการดําเนินการกลุ่ม/ชุดงาน การสร้างไปป์ไลน์ข้อมูลใน Data Factory ยังคงพิสูจน์ความท้าทายสําหรับผู้ใช้หลายคนที่ยังใหม่กับเขตข้อมูลด้วยเส้นโค้งการเรียนรู้ที่แยกจากกัน ดังนั้นเราจึงตื่นเต้นที่จะแนะนํางานคัดลอกเพื่อยกระดับประสบการณ์การนําเข้าข้อมูลสู่กระบวนการที่คล่องตัวและใช้งานง่ายยิ่งขึ้นจากต้นทางใด ๆ ไปยังปลายทางใด ๆ ตอนนี้ การคัดลอกข้อมูลของคุณนั้นง่ายกว่าที่เคย นอกจากนี้ งานคัดลอกยังรองรับรูปแบบการจัดส่งข้อมูลต่าง ๆ รวมถึงการคัดลอกชุดงานและสําเนาแบบเพิ่มหน่วย ซึ่งมีความยืดหยุ่นในการตอบสนองความต้องการเฉพาะของคุณ
ข้อดีบางประการของงานคัดลอกผ่านวิธีการย้ายข้อมูลอื่น ๆ ได้แก่:
- ประสบการณ์ที่ใช้งานง่าย: สัมผัสประสบการณ์การคัดลอกข้อมูลที่ราบรื่นโดยไม่ลดทอนและทําให้ง่ายกว่าที่เคย
- ประสิทธิภาพ: ช่วยให้สามารถคัดลอกแบบเพิ่มทีละส่วนได้อย่างง่ายดายลดการแทรกแซงด้วยตนเอง ประสิทธิภาพนี้แปลเป็นการใช้ทรัพยากรน้อยลงและระยะเวลาการคัดลอกที่รวดเร็วขึ้น
- ความยืดหยุ่น: ในขณะที่เพลิดเพลินไปกับความเรียบง่าย คุณยังมีความยืดหยุ่นในการควบคุมการเคลื่อนไหวของข้อมูลของคุณ เลือกตารางและคอลัมน์ที่จะคัดลอก แมปข้อมูล กําหนดลักษณะการทํางานการอ่าน/เขียน และตั้งค่ากําหนดการที่เหมาะสมกับความต้องการของคุณ ไม่ว่าจะเป็นงานครั้งเดียวหรือการดําเนินการที่เกิดซ้ํา
- ประสิทธิภาพที่แข็งแกร่ง: การตั้งค่าแบบไร้เซิร์ฟเวอร์ช่วยให้การถ่ายโอนข้อมูลมีความขนานขนาดใหญ่เพิ่มอัตราความเร็วการเคลื่อนย้ายข้อมูลสําหรับระบบของคุณให้สูงสุด
ตัวเชื่อมต่อที่สนับสนุน
ในปัจจุบัน คุณสามารถใช้งาน คัดลอก สําหรับการโอนย้ายข้อมูลบนคลาวด์ หรือคัดลอกข้อมูลจากที่เก็บข้อมูลภายในองค์กรผ่านเกตเวย์ได้ งานคัดลอกสนับสนุนที่เก็บข้อมูลต่อไปนี้เป็นทั้งต้นทางและปลายทาง:
- Azure SQL DB
- SQL Server ภายในองค์กร
- คลังสินค้าผ้า
- Fabric Lakehouse
- Amazon S3
- Azure Data Lake Storage รุ่น2
- ที่เก็บข้อมูล Azure Blob
- Amazon RDS สําหรับ SQL Server
ทีมผลิตภัณฑ์กําลังสํารวจการสนับสนุนตัวเชื่อมต่อเพิ่มเติม โปรด ติดตามการอัปเดตอยู่เสมอ
คัดลอกลักษณะการทํางาน
คุณสามารถเลือกจากลักษณะการจัดส่งข้อมูลต่อไปนี้
- โหมดคัดลอกแบบเต็ม: แต่ละงานคัดลอกจะคัดลอกข้อมูลทั้งหมดจากต้นทางไปยังปลายทางในครั้งเดียว
- โหมดการคัดลอกแบบเพิ่มหน่วย: งานเริ่มต้นจะคัดลอกข้อมูลทั้งหมด และงานต่อมาจะคัดลอกเฉพาะการเปลี่ยนแปลงนับตั้งแต่เรียกใช้ครั้งล่าสุดเท่านั้น ข้อมูลที่เปลี่ยนแปลงจะถูกผนวกเข้ากับที่เก็บปลายทางของคุณ
คุณยังสามารถเลือกวิธีเขียนข้อมูลลงในที่เก็บปลายทางของคุณ
ตามค่าเริ่มต้น งาน คัดลอกจะผนวก ข้อมูลไปยังปลายทางของคุณเพื่อที่คุณจะได้ไม่พลาดประวัติการเปลี่ยนแปลง แต่คุณยังสามารถปรับลักษณะการทํางานการเขียนให้ upsert หรือ เขียนทับได้
- เมื่อคัดลอกข้อมูลไปยังที่จัดเก็บ: แถวใหม่จากตารางหรือไฟล์จะถูกคัดลอกไปยังไฟล์ใหม่ในปลายทาง ถ้ามีไฟล์ที่มีชื่อเดียวกันอยู่แล้วในที่เก็บเป้าหมาย ไฟล์นั้นจะถูกเขียนทับ
- เมื่อคัดลอกข้อมูลไปยังฐานข้อมูล: แถวใหม่จากตารางหรือไฟล์จะถูกผนวกเข้ากับตารางปลายทาง คุณสามารถเปลี่ยนลักษณะการทํางานการเขียนเป็น upsert (บน SQL DB หรือ SQL Server) หรือเขียนทับ (บนตาราง Fabric Lakehouse)
คอลัมน์แบบเพิ่มหน่วย
ในโหมดคัดลอกแบบเพิ่มหน่วย คุณจะต้องเลือกคอลัมน์แบบเพิ่มหน่วยสําหรับแต่ละตารางเพื่อระบุการเปลี่ยนแปลง งานคัดลอกจะใช้คอลัมน์นี้เป็นลายน้ํา โดยเปรียบเทียบค่ากับค่าเดียวกันจากการทํางานครั้งล่าสุดเพื่อคัดลอกข้อมูลใหม่หรืออัปเดตเท่านั้น คอลัมน์แบบเพิ่มหน่วยจะต้องเป็นการประทับเวลาหรือ INT ที่เพิ่มขึ้น
ความพร้อมของภูมิภาค
งานคัดลอกมีความพร้อมใช้งานระดับภูมิภาคเดียวกันกับไปป์ไลน์
การกำหนดราคา
งานคัดลอกใช้ตัววัดการเรียกเก็บเงินเดียวกัน: การย้ายข้อมูลด้วยอัตราปริมาณการใช้ที่เหมือนกัน