โหลดไปยังตารางทะเลสาบเดลต้า
Lakehouse ใน Microsoft Fabric มีคุณสมบัติในการโหลดไฟล์ประเภททั่วไปลงในตาราง Delta ที่ปรับให้เหมาะสมเพื่อการวิเคราะห์ได้อย่างมีประสิทธิภาพ คุณลักษณะโหลดไปยังตารางช่วยให้ผู้ใช้สามารถโหลดไฟล์เดียวหรือโฟลเดอร์ของไฟล์ไปยังตารางได้ คุณลักษณะนี้จะเพิ่มประสิทธิภาพการทํางานสําหรับวิศวกรข้อมูลโดยช่วยให้วิศวกรสามารถใช้งานการคลิกขวาได้อย่างรวดเร็วเพื่อเปิดใช้งานการโหลดตารางในไฟล์และโฟลเดอร์ การโหลดไปยังตารางยังเป็น ประสบการณ์ที่ไม่มีรหัส ซึ่งลดแถบรายการสําหรับบุคคลทั้งหมด
ภาพรวมความสามารถของโหลดไปยังตาราง
นี่คือรายการของคุณลักษณะที่เราเปิดใช้งานในโหลดแบบรวมสําหรับประสบการณ์การใช้งานตารางเพื่อให้ผู้ใช้ของเรามีความยืดหยุ่นในขณะเพิ่มผลผลิตของพวกเขา:
ชนิดไฟล์ที่ได้รับการสนับสนุน: ปัจจุบันคุณลักษณะนี้รองรับการโหลดประเภทไฟล์ PARQUET หรือ CSV เท่านั้น กรณีส่วนขยายของไฟล์ไม่สําคัญ
การโหลดไฟล์เดียว: ผู้ใช้สามารถโหลดไฟล์เดียวตามตัวเลือกของพวกเขาในรูปแบบที่สนับสนุนโดยการเลือก "โหลดไปยังตาราง Delta" ในการดําเนินการของเมนูบริบทของไฟล์
การโหลดระดับโฟลเดอร์: คุณสามารถโหลดไฟล์ทั้งหมดภายใต้โฟลเดอร์และโฟลเดอร์ย่อยพร้อมกันโดยการเลือก "โหลดไปยังตาราง Delta" หลังจากคลิกที่โฟลเดอร์ คุณลักษณะนี้จะสํารวจไฟล์ทั้งหมดโดยอัตโนมัติและโหลดไปยังตาราง Delta สิ่งสําคัญคือต้องทราบว่าสามารถโหลดไฟล์ประเภทเดียวกันเท่านั้นในเวลาเดียวกันไปยังตาราง
โหลดไปยังตารางใหม่และตารางที่มีอยู่: ผู้ใช้สามารถเลือกที่จะโหลดไฟล์และโฟลเดอร์ของไฟล์เหล่านั้นไปยังตารางใหม่หรือตารางตัวเลือกที่มีอยู่ได้ ถ้าพวกเขาตัดสินใจที่จะโหลดไปยังตารางที่มีอยู่ พวกเขาสามารถผนวกหรือเขียนทับข้อมูลของพวกเขาในตารางได้
ตัวเลือกไฟล์ต้นฉบับ CSV: สําหรับไฟล์ CSV เราอนุญาตให้ผู้ใช้ระบุว่าไฟล์ต้นฉบับของพวกเขามีส่วนหัวที่พวกเขาต้องการใช้เป็นชื่อคอลัมน์หรือไม่ ผู้ใช้สามารถระบุตัวคั่นของตัวเลือกของพวกเขาเพื่อแทนที่ตัวคั่นจุลภาคเริ่มต้นในสถานที่
โหลดเป็นตาราง Delta: ตารางจะโหลดเสมอโดยใช้รูปแบบตาราง Delta Lake ที่เปิดใช้งานการปรับให้เหมาะสมแบบ V-Order
หมายเหตุ
ในปัจจุบัน คุณไม่สามารถระบุ Schema ของตารางผ่าน Lakehouse UI ได้ คุณต้องใช้สมุดบันทึกเพื่อจุดประสงค์นั้น
แนวทางและกฎการตรวจสอบความถูกต้อง
มาตรฐานต่อไปนี้นําไปใช้กับประสบการณ์โหลดไปยังตาราง:
ชื่อตารางสามารถมีได้เฉพาะอักขระพยัญชนะผสมตัวเลขและเครื่องหมายขีดล่างเท่านั้น นอกจากนี้ยังอนุญาตให้มีตัวอักษรภาษาอังกฤษ ตัวพิมพ์ใหญ่ หรือตัวพิมพ์เล็ก และขีดล่าง (
_
) ที่มีความยาวสูงสุด 256 อักขระ ไม่อนุญาตให้ใช้เส้นประ (-
) หรืออักขระช่องว่างไฟล์ข้อความที่ไม่มีส่วนหัวของคอลัมน์จะถูกแทนที่ด้วยสแทนมาตรฐาน
col#
เป็นชื่อคอลัมน์ตารางชื่อคอลัมน์อนุญาตให้มีตัวอักษรภาษาอังกฤษ ตัวพิมพ์ใหญ่ หรือตัวพิมพ์เล็ก ขีดล่าง (
_
) และอักขระในภาษาอื่น เช่น ภาษาจีนใน UTF ความยาวสูงสุด 128 อักขระ ชื่อคอลัมน์จะถูกตรวจสอบในระหว่างการโหลดการดําเนินการ อัลกอริทึมโหลดไปยัง Delta แทนที่ค่าห้ามใช้งานด้วยแถบใต้ (_
) ถ้าไม่มีชื่อคอลัมน์ที่เหมาะสมในระหว่างการตรวจสอบความถูกต้อง การดําเนินการโหลดจะล้มเหลวสําหรับไฟล์ CSV ตัวคั่นไม่สามารถว่างเปล่าได้ต้องมีความยาวไม่เกิน 8 อักขระหรือใช้อักขระใด ๆ ต่อไปนี้:
(
, ,)
[
,]
,{
,}
เครื่องหมายอัญประกาศเดี่ยว ('
), เครื่องหมายอัญประกาศคู่ ("
) และช่องว่าง