แชร์ผ่าน


โหลดไปยังตารางทะเลสาบเดลต้า

Lakehouse ใน Microsoft Fabric มีคุณสมบัติในการโหลดไฟล์ประเภททั่วไปลงในตาราง Delta ที่ปรับให้เหมาะสมเพื่อการวิเคราะห์ได้อย่างมีประสิทธิภาพ คุณลักษณะโหลดไปยังตารางช่วยให้ผู้ใช้สามารถโหลดไฟล์เดียวหรือโฟลเดอร์ของไฟล์ไปยังตารางได้ คุณลักษณะนี้จะเพิ่มประสิทธิภาพการทํางานสําหรับวิศวกรข้อมูลโดยช่วยให้วิศวกรสามารถใช้งานการคลิกขวาได้อย่างรวดเร็วเพื่อเปิดใช้งานการโหลดตารางในไฟล์และโฟลเดอร์ การโหลดไปยังตารางยังเป็น ประสบการณ์ที่ไม่มีรหัส ซึ่งลดแถบรายการสําหรับบุคคลทั้งหมด

ภาพรวมความสามารถของโหลดไปยังตาราง

นี่คือรายการของคุณลักษณะที่เราเปิดใช้งานในโหลดแบบรวมสําหรับประสบการณ์การใช้งานตารางเพื่อให้ผู้ใช้ของเรามีความยืดหยุ่นในขณะเพิ่มผลผลิตของพวกเขา:

  • ชนิดไฟล์ที่ได้รับการสนับสนุน: ปัจจุบันคุณลักษณะนี้รองรับการโหลดประเภทไฟล์ PARQUET หรือ CSV เท่านั้น กรณีส่วนขยายของไฟล์ไม่สําคัญ

  • การโหลดไฟล์เดียว: ผู้ใช้สามารถโหลดไฟล์เดียวตามตัวเลือกของพวกเขาในรูปแบบที่สนับสนุนโดยการเลือก "โหลดไปยังตาราง Delta" ในการดําเนินการของเมนูบริบทของไฟล์

  • การโหลดระดับโฟลเดอร์: คุณสามารถโหลดไฟล์ทั้งหมดภายใต้โฟลเดอร์และโฟลเดอร์ย่อยพร้อมกันโดยการเลือก "โหลดไปยังตาราง Delta" หลังจากคลิกที่โฟลเดอร์ คุณลักษณะนี้จะสํารวจไฟล์ทั้งหมดโดยอัตโนมัติและโหลดไปยังตาราง Delta สิ่งสําคัญคือต้องทราบว่าสามารถโหลดไฟล์ประเภทเดียวกันเท่านั้นในเวลาเดียวกันไปยังตาราง

  • โหลดไปยังตารางใหม่และตารางที่มีอยู่: ผู้ใช้สามารถเลือกที่จะโหลดไฟล์และโฟลเดอร์ของไฟล์เหล่านั้นไปยังตารางใหม่หรือตารางตัวเลือกที่มีอยู่ได้ ถ้าพวกเขาตัดสินใจที่จะโหลดไปยังตารางที่มีอยู่ พวกเขาสามารถผนวกหรือเขียนทับข้อมูลของพวกเขาในตารางได้

  • ตัวเลือกไฟล์ต้นฉบับ CSV: สําหรับไฟล์ CSV เราอนุญาตให้ผู้ใช้ระบุว่าไฟล์ต้นฉบับของพวกเขามีส่วนหัวที่พวกเขาต้องการใช้เป็นชื่อคอลัมน์หรือไม่ ผู้ใช้สามารถระบุตัวคั่นของตัวเลือกของพวกเขาเพื่อแทนที่ตัวคั่นจุลภาคเริ่มต้นในสถานที่

  • โหลดเป็นตาราง Delta: ตารางจะโหลดเสมอโดยใช้รูปแบบตาราง Delta Lake ที่เปิดใช้งานการปรับให้เหมาะสมแบบ V-Order

    Gif ของโฟลเดอร์โหลดโดยรวมไปยังประสบการณ์การใช้งานตาราง

หมายเหตุ

ในปัจจุบัน คุณไม่สามารถระบุ Schema ของตารางผ่าน Lakehouse UI ได้ คุณต้องใช้สมุดบันทึกเพื่อจุดประสงค์นั้น

แนวทางและกฎการตรวจสอบความถูกต้อง

มาตรฐานต่อไปนี้นําไปใช้กับประสบการณ์โหลดไปยังตาราง:

  • ชื่อตารางสามารถมีได้เฉพาะอักขระพยัญชนะผสมตัวเลขและเครื่องหมายขีดล่างเท่านั้น นอกจากนี้ยังอนุญาตให้มีตัวอักษรภาษาอังกฤษ ตัวพิมพ์ใหญ่ หรือตัวพิมพ์เล็ก และขีดล่าง (_) ที่มีความยาวสูงสุด 256 อักขระ ไม่อนุญาตให้ใช้เส้นประ (-) หรืออักขระช่องว่าง

  • ไฟล์ข้อความที่ไม่มีส่วนหัวของคอลัมน์จะถูกแทนที่ด้วยสแทนมาตรฐาน col# เป็นชื่อคอลัมน์ตาราง

  • ชื่อคอลัมน์อนุญาตให้มีตัวอักษรภาษาอังกฤษ ตัวพิมพ์ใหญ่ หรือตัวพิมพ์เล็ก ขีดล่าง (_) และอักขระในภาษาอื่น เช่น ภาษาจีนใน UTF ความยาวสูงสุด 128 อักขระ ชื่อคอลัมน์จะถูกตรวจสอบในระหว่างการโหลดการดําเนินการ อัลกอริทึมโหลดไปยัง Delta แทนที่ค่าห้ามใช้งานด้วยแถบใต้ (_) ถ้าไม่มีชื่อคอลัมน์ที่เหมาะสมในระหว่างการตรวจสอบความถูกต้อง การดําเนินการโหลดจะล้มเหลว

  • สําหรับไฟล์ CSV ตัวคั่นไม่สามารถว่างเปล่าได้ต้องมีความยาวไม่เกิน 8 อักขระหรือใช้อักขระใด ๆ ต่อไปนี้: (, , )[, ],{ , }เครื่องหมายอัญประกาศเดี่ยว ('), เครื่องหมายอัญประกาศคู่ (") และช่องว่าง