แบบแผนของเลคเฮ้าส์ (ตัวอย่าง) คืออะไร
เลคเฮ้าส์รองรับการสร้าง Schema แบบกําหนดเอง Schema ช่วยให้คุณสามารถจัดกลุ่มตารางของคุณเข้าด้วยกันเพื่อให้สามารถค้นหาข้อมูลได้ดีขึ้น ควบคุมการเข้าถึง และอื่น ๆ
สร้างโครงสร้างของเลคเฮ้าส์
หากต้องการเปิดใช้งานการสนับสนุน Schema สําหรับเลคเฮ้าส์ของคุณ ให้ตรวจสอบกล่องถัดจาก Schema ของเลคเฮ้าส์ (ตัวอย่างสาธารณะ) เมื่อคุณสร้าง
สำคัญ
ชื่อพื้นที่ทํางานต้องมีอักขระพยัญชนะผสมตัวเลขเท่านั้นเนื่องจากข้อจํากัดการแสดงตัวอย่าง หากมีการใช้อักขระพิเศษในชื่อพื้นที่ทํางาน คุณลักษณะบางอย่างของ Lakehouse จะไม่ทํางาน
เมื่อคุณสร้างเลคเฮ้าส์ คุณสามารถค้นหาสคีมาเริ่มต้นที่ชื่อว่า dbo ภายใต้ ตาราง Schema นี้มักจะอยู่ที่นั่น และไม่สามารถเปลี่ยนแปลงหรือเอาออกได้ เมื่อต้องการสร้าง Schema ใหม่ ให้วางเมาส์เหนือ ตาราง เลือก ... และเลือก Schema ใหม่ ใส่ชื่อสคีมาของคุณ และเลือก สร้าง คุณจะเห็น schema ของคุณแสดงอยู่ภายใต้ ตาราง ตามลําดับตัวอักษร
จัดเก็บตารางในแบบแผนของเลคเฮ้าส์
คุณต้องมีชื่อ Schema เพื่อจัดเก็บตารางใน Schema มิฉะนั้น จะไปที่ schema dbo เริ่มต้น
df.write.mode("Overwrite").saveAsTable("contoso.sales")
คุณสามารถใช้ Lakehouse Explorer เพื่อจัดเรียงตารางของคุณ และลากและวางชื่อตารางไปยัง Schema ที่แตกต่างกัน
ข้อควรระวัง
ถ้าคุณปรับเปลี่ยนตาราง คุณยังต้องอัปเดตรายการที่เกี่ยวข้อง เช่น รหัสสมุดบันทึกหรือกระแสข้อมูล เพื่อให้แน่ใจว่าสอดคล้องกับ Schema ที่ถูกต้อง
นําตารางหลายตารางที่มีทางลัด Schema มาใช้
หากต้องการอ้างอิงตาราง Delta หลายตารางจาก Lakehouse ของ Fabric หรือที่เก็บข้อมูลภายนอก ให้ใช้ทางลัด Schema ที่แสดงตารางทั้งหมดภายใต้ schema หรือโฟลเดอร์ที่เลือก การเปลี่ยนแปลงใด ๆ ไปยังตารางในตําแหน่งที่ตั้งต้นทางจะปรากฏใน schema หากต้องการสร้างทางลัดของ Schema ให้วางเมาส์เหนือ ตาราง เลือกที่ ... และเลือก ทางลัด Schema ใหม่ จากนั้นเลือก Schema ในเลคเฮ้าส์อื่น หรือโฟลเดอร์ที่มีตาราง Delta บนที่เก็บข้อมูลภายนอกของคุณ เช่น Azure Data Lake Storage (ADLS) Gen2 ที่สร้างสคีมาใหม่ด้วยตารางอ้างอิงของคุณ
เข้าถึง schema ของ lakehouse สําหรับการรายงาน Power BI
หากต้องการสร้างแบบจําลองความหมายของคุณ เพียงแค่เลือกตารางที่คุณต้องการใช้ ตารางสามารถอยู่ในรูปแบบที่แตกต่างกัน ถ้าตารางจากสคีมาที่แตกต่างกันใช้ชื่อเดียวกัน คุณจะเห็นตัวเลขถัดจากชื่อตารางเมื่ออยู่ในมุมมองแบบจําลอง
Schema ของเลคเฮ้าส์ในสมุดบันทึก
เมื่อคุณดู schema ที่เปิดใช้งาน lakehouse ในตัวสํารวจวัตถุของสมุดบันทึก คุณเห็นตารางอยู่ใน schema คุณสามารถลากและวางตารางลงในเซลล์โค้ดและรับส่วนย่อยของโค้ดที่อ้างถึง schema ที่ตารางอยู่ ใช้ namespace นี้เพื่ออ้างอิงถึงตารางในโค้ดของคุณ: "workspace.lakehouse.schema.table" ถ้าคุณออกจากองค์ประกอบใด ๆ ตัวดําเนินการจะใช้การตั้งค่าเริ่มต้น ตัวอย่างเช่น ถ้าคุณตั้งชื่อตารางเท่านั้น ระบบจะใช้ Schema เริ่มต้น (dbo) จาก lakehouse ตามค่าเริ่มต้นสําหรับสมุดบันทึก
สำคัญ
ถ้าคุณต้องการใช้ schemas ในโค้ดของคุณ ตรวจสอบให้แน่ใจว่า lakehouse ค่าเริ่มต้นสําหรับสมุดบันทึกถูกเปิดใช้งาน schema
คิวรี Spark SQL แบบข้ามพื้นที่ทํางาน
ใช้ namespace "workspace.lakehouse.schema" เพื่ออ้างอิงตารางในโค้ดของคุณ ด้วยวิธีนี้ คุณสามารถรวมตารางจากพื้นที่ทํางานที่แตกต่างกันหากผู้ใช้ที่เรียกใช้โค้ดมีสิทธิ์ในการเข้าถึงตาราง
SELECT *
FROM operations.hr.hrm.employees as employees
INNER JOIN global.corporate.company.departments as departments
ON employees.deptno = departments.deptno;
สำคัญ
ตรวจสอบให้แน่ใจว่าคุณรวมตารางจากเลคเฮ้าส์ที่เปิดใช้งาน schema เท่านั้น การเข้าร่วมตารางจากเลคเฮ้าส์ที่ไม่มี Schema ที่เปิดใช้งานจะไม่ทํางาน
ข้อจํากัดการแสดงตัวอย่างสาธารณะ
ด้านล่างแสดงคุณลักษณะ/ฟังก์ชันการทํางานที่ไม่ได้รับการรองรับสําหรับการเผยแพร่ปัจจุบันของการแสดงตัวอย่างสาธารณะ พวกเขาจะได้รับการแก้ไขในรุ่นต่อ ๆ ไปก่อนความพร้อมใช้งานทั่วไป
คุณลักษณะ/ฟังก์ชันการทํางานที่ไม่รองรับ | บันทึกย่อ |
---|---|
แชร์เลคเฮ้าส์ | การใช้พื้นที่ทํางานในเนมสเปซสําหรับเลคเฮ้าส์ที่ใช้ร่วมกันจะไม่ทํางานเช่น wokrkspace.sharedlakehouse.schema.table ผู้ใช้ต้องมีบทบาทพื้นที่ทํางานเพื่อใช้พื้นที่ทํางานใน namaspace |
ไม่ใช่ Delta, เค้าร่างตารางที่มีการจัดการ | การรับ Schema สําหรับตารางที่มีการจัดการ และไม่ใช่ตารางที่มีการจัดรูปแบบตามส่วนที่แตกต่าง (ตัวอย่างเช่น CSV) ไม่ได้รับการสนับสนุน การขยายตารางเหล่านี้ในตัวสํารวจของ lakehouse จะไม่แสดงข้อมูล Schema ใด ๆ ใน UX |
ตาราง Spark ภายนอก | การดําเนินการตาราง Spark ภายนอก (ตัวอย่างเช่น การค้นพบ การรับ schema และอื่น ๆ) ไม่ได้รับการสนับสนุน ตารางเหล่านี้จะถูกระบุใน UX |
API สาธารณะ | API สาธารณะ (ตารางรายการ, โหลดตาราง, แสดงค่าเริ่มต้นคุณสมบัติเพิ่มเติมของ Schema ฯลฯ) ไม่ได้รับการรองรับสําหรับ Schema ที่เปิดใช้งาน Lakehouse API สาธารณะที่มีอยู่ที่เรียกว่าบน Schema ที่เปิดใช้งาน Lakehouse จะแสดงข้อผิดพลาด |
การบํารุงรักษาตาราง | ไม่สนับสนุน |
อัปเดตคุณสมบัติตาราง | ไม่สนับสนุน |
ชื่อพื้นที่ทํางานที่มีอักขระพิเศษ | พื้นที่ทํางานที่มีอักขระพิเศษ (ตัวอย่างเช่น ช่องว่าง เครื่องหมายทับ) ไม่ได้รับการสนับสนุน ข้อผิดพลาดของผู้ใช้จะแสดงขึ้น |
มุมมอง Spark | ไม่สนับสนุน |
คุณลักษณะเฉพาะของ Hive | ไม่สนับสนุน |
Spark.catalog API | ไม่สนับสนุน ใช้ Spark SQL แทน |
USE <schemaName> |
ไม่ทํางานข้ามพื้นที่ทํางาน แต่ได้รับการสนับสนุนภายในพื้นที่ทํางานเดียวกัน |
การโยกย้าย | การโยกย้ายของเลคเฮ้าส์ที่ไม่ใช่ schema ที่มีอยู่ไปยังเลคเฮ้าส์ที่ใช้ Schema ไม่ได้รับการสนับสนุน |