บันทึก Delta Lake ใน Warehouse ใน Microsoft Fabric
นําไปใช้กับ:✅ Warehouse ใน Microsoft Fabric
คลังสินค้าใน Microsoft Fabric ถูกสร้างรูปแบบไฟล์แบบเปิด ตารางผู้ใช้จะถูกจัดเก็บในรูปแบบไฟล์ parquet และบันทึก Delta Lake มีการเผยแพร่สําหรับตารางผู้ใช้ทั้งหมด
บันทึก Delta Lake เปิดขึ้นเพื่อเข้าถึงตารางผู้ใช้ของคลังสินค้าโดยตรงสําหรับเครื่องมือใด ๆ ที่สามารถอ่านตาราง Delta Lake ได้ การเข้าถึงนี้จํากัดให้เป็นแบบอ่านอย่างเดียวเพื่อให้แน่ใจว่าข้อมูลผู้ใช้รักษาการปฏิบัติตามกฎระเบียบของการทําธุรกรรม ACID การแทรก ปรับปรุง และการลบทั้งหมดไปยังข้อมูลในตารางต้องได้รับการดําเนินการผ่านคลังสินค้า เมื่อทรานแซคชันถูกกําหนด กระบวนการพื้นหลังของระบบจะเริ่มต้นในการเผยแพร่บันทึก Delta Lake ที่อัปเดตแล้วสําหรับตารางที่ได้รับผลกระทบ
วิธีรับเส้นทาง OneLake
ขั้นตอนต่อไปนี้แสดงรายละเอียดวิธีการรับเส้นทาง OneLake จากตารางในคลังสินค้า:
เปิด Warehouse ในพื้นที่ทํางาน Microsoft Fabric ของคุณ
ใน Object Explorer คุณจะพบตัวเลือกเพิ่มเติม (...) บนตารางที่เลือกในโฟลเดอร์ ตาราง เลือกเมนู คุณสมบัติ
เมื่อเลือก บานหน้าต่างคุณสมบัติ แสดงข้อมูลต่อไปนี้:
- ชื่อ
- รูปแบบ
- ขนิด
- URL
- เส้นทางสัมพัทธ์
- เส้นทาง ABFS
วิธีการรับเส้นทางบันทึก Delta Lake
คุณสามารถค้นหาบันทึก Delta Lake ผ่านวิธีการต่อไปนี้:
บันทึกของทะเลสาบเดลต้าสามารถคิวรีผ่าน ทางลัด ที่สร้างขึ้นในเลคเฮ้าส์ คุณสามารถดูไฟล์ได้โดยใช้ Microsoft Fabric Spark Notebook หรือ Lakehouse explorer ใน Fabric วิศวกรข้อมูลในพอร์ทัล Microsoft Fabric
สามารถพบบันทึก Delta Lake ได้ผ่าน Azure Storage Explorer ผ่านการเชื่อมต่อ Spark เช่น โหมด Power BI Direct Lake หรือใช้บริการอื่น ๆ ที่สามารถอ่านตาราง delta ได้
บันทึก Delta Lake สามารถพบได้ใน
_delta_log
โฟลเดอร์ของแต่ละตารางผ่าน OneLake Explorer ใน Windows ดังที่แสดงในภาพหน้าจอต่อไปนี้
หยุดการเผยแพร่บันทึก Delta Lake
การเผยแพร่บันทึก Delta Lake สามารถหยุดชั่วคราวและดําเนินการต่อได้ถ้าจําเป็น เมื่อการเผยแพร่หยุดชั่วคราว กลไก Microsoft Fabric ที่อ่านตารางภายนอกคลังสินค้าจะเห็นข้อมูลเหมือนก่อนที่จะหยุดชั่วคราว ซึ่งทําให้แน่ใจว่ารายงานยังคงเสถียรและสอดคล้องกัน สะท้อนข้อมูลจากตารางทั้งหมดเหมือนที่มีอยู่ก่อนที่จะมีการเปลี่ยนแปลงใด ๆ กับตาราง เมื่อการอัปเดตข้อมูลของคุณเสร็จสมบูรณ์ คุณสามารถดําเนินการเผยแพร่ Delta Lake Log ต่อเพื่อทําให้การเปลี่ยนแปลงข้อมูลล่าสุดทั้งหมดมองเห็นได้โดยเครื่องมือวิเคราะห์อื่น ๆ อีกกรณีการใช้งานสําหรับการหยุดการเผยแพร่บันทึก Delta Lake คือเมื่อผู้ใช้ไม่จําเป็นต้องทํางานร่วมกับเครื่องมือคํานวณอื่น ๆ ใน Microsoft Fabric เนื่องจากสามารถช่วยประหยัดค่าใช้จ่ายในการคํานวณได้
ไวยากรณ์ที่จะหยุดและดําเนินต่อการเผยแพร่บันทึก Delta Lake มีดังนี้:
ALTER DATABASE CURRENT SET DATA_LAKE_LOG_PUBLISHING = PAUSED | AUTO
ตัวอย่าง: หยุดชั่วคราวและดําเนินต่อการเผยแพร่บันทึก Delta Lake
เพื่อหยุดการเผยแพร่บันทึก Delta Lake ให้ใช้ส่วนย่อยของโค้ดต่อไปนี้:
ALTER DATABASE CURRENT SET DATA_LAKE_LOG_PUBLISHING = PAUSED
คิวรีไปยังตารางคลังข้อมูลบนคลังสินค้าปัจจุบันจากเครื่องมือ Microsoft Fabric อื่น ๆ (ตัวอย่างเช่น คิวรีจากเลคเฮ้าส์) ตอนนี้แสดงเวอร์ชันของข้อมูลเหมือนก่อนที่จะหยุดการเผยแพร่บันทึก Delta Lake คิวรีคลังยังคงแสดงข้อมูลเวอร์ชันล่าสุด
หากต้องการดําเนินการเผยแพร่บันทึก Delta Lake ต่อ ให้ใช้ส่วนย่อยของโค้ดต่อไปนี้:
ALTER DATABASE CURRENT SET DATA_LAKE_LOG_PUBLISHING = AUTO
เมื่อเปลี่ยนสถานะเป็น AUTO กลไก Fabric Warehouse จะเผยแพร่บันทึกการเปลี่ยนแปลงล่าสุดทั้งหมดที่ทํากับตารางในคลังสินค้า ช่วยให้กลไกการวิเคราะห์อื่น ๆ ใน Microsoft Fabric สามารถอ่านข้อมูลเวอร์ชันล่าสุดได้
ตรวจสอบสถานะของการเผยแพร่บันทึก Delta Lake
ในการตรวจสอบสถานะปัจจุบันของบันทึก Delta Lake ที่เผยแพร่บนคลังสินค้าทั้งหมดสําหรับพื้นที่ทํางานปัจจุบัน ให้ใช้ส่วนย่อยของโค้ดต่อไปนี้:
SELECT [name], [DATA_LAKE_LOG_PUBLISHING_DESC] FROM sys.databases
ข้อจำกัด
- ชื่อตารางสามารถใช้ได้โดย Spark และระบบอื่น ๆ เท่านั้นถ้าประกอบด้วยอักขระเหล่านี้เท่านั้น: A-Z a-z 0-9 และขีดล่าง
- ชื่อคอลัมน์ที่จะใช้โดย Spark และระบบอื่นไม่สามารถมีได้:
- ช่องว่าง
- แท็บ
- อักขระขึ้นบรรทัดใหม่
- [
- ,
- ;
- {
- }
- (
- )
- =
- ]