ลิงก์เชิงความหมายคืออะไร
การเชื่อมโยงเชิงความหมายเป็นคุณลักษณะที่ช่วยให้คุณสามารถสร้างการเชื่อมต่อระหว่าง แบบจําลอง ความหมายและ Synapse Data Science ใน Microsoft Fabric ใช้การเชื่อมโยงความหมายได้รับการสนับสนุนใน Microsoft Fabric เท่านั้น
สําหรับ Spark 3.4 และสูงกว่า ลิงก์เชิงความหมายจะพร้อมใช้งานในรันไทม์เริ่มต้นเมื่อใช้ Fabric และไม่จําเป็นต้องติดตั้ง
สําหรับ Spark 3.3 หรือด้านล่าง หรือเมื่อต้องการอัปเดตเป็นลิงก์เชิงความหมายเวอร์ชันล่าสุด ให้เรียกใช้คําสั่งต่อไปนี้:
%pip install -U semantic-link
เป้าหมายหลักของการเชื่อมโยงความหมายคือ:
- อํานวยความสะดวกในการเชื่อมต่อข้อมูล
- เปิดใช้งานการเผยแพร่ข้อมูลความหมาย
- รวมเข้ากับการใช้ข้อมูลเครื่องมือที่สร้างขึ้นอย่างราบรื่น เช่น สมุดบันทึก
ลิงก์เชิงความหมายช่วยให้คุณเก็บรักษาความรู้โดเมนเกี่ยวกับตรรกะข้อมูลในลักษณะที่เป็นมาตรฐานซึ่งสามารถเร่งการวิเคราะห์ข้อมูลให้เร็วขึ้นและลดข้อผิดพลาดได้
โฟลว์ข้อมูลลิงก์เชิงความหมาย
โฟลว์ข้อมูลลิงก์ความหมายเริ่มต้นด้วยแบบจําลองความหมายที่ประกอบด้วยข้อมูลและข้อมูลเชิงความหมาย การเชื่อมโยงเชิงความหมายจะเชื่อมโยงช่องว่างระหว่าง Power BI และประสบการณ์วิทยาศาสตร์ข้อมูล Synapse
ลิงก์เชิงความหมายช่วยให้คุณสามารถใช้แบบจําลองความหมายจาก Power BI ในประสบการณ์วิทยาศาสตร์ข้อมูล Synapse เพื่อทํางานต่าง ๆ เช่น การวิเคราะห์เชิงลึกและการสร้างแบบจําลองเชิงทํานายด้วยเทคนิคการเรียนรู้ของเครื่อง คุณสามารถจัดเก็บผลลัพธ์ของวิทยาศาสตร์ข้อมูลของคุณลงใน OneLake ได้โดยใช้ Apache Spark และนําเข้าเอาต์พุตที่จัดเก็บไว้ใน Power BI โดยใช้ Direct Lake
การเชื่อมต่อ Power BI
แบบจําลองความหมายทําหน้าที่เป็นแบบจําลองวัตถุตารางเดียวที่มีแหล่งข้อมูลที่เชื่อถือได้สําหรับข้อกําหนดเชิงความหมาย เช่น หน่วยวัด Power BI การเชื่อมโยงเชิงความหมายเชื่อมต่อกับแบบจําลองเชิงความหมายในระบบนิเวศต่อไปนี้ ทําให้ง่ายสําหรับนักวิทยาศาสตร์ข้อมูลในการทํางานในระบบที่พวกเขาคุ้นเคยมากที่สุด
- ระบบนิเวศของ Python pandas ผ่าน ไลบรารี SemPy Python
- ระบบนิเวศ Apache Spark ผ่านตัว เชื่อมต่อ Spark แบบเนทีฟ การใช้งานนี้สนับสนุนภาษาต่างๆ รวมถึง PySpark, Spark SQL, R และ Scala
แอปพลิเคชันของข้อมูลความหมาย
ข้อมูลเชิงความหมายในข้อมูลประกอบด้วยประเภทข้อมูล Power BI เช่น ที่อยู่และรหัสไปรษณีย์ ความสัมพันธ์ระหว่างตาราง และข้อมูลแบบลําดับชั้น
หมวดหมู่ข้อมูลเหล่านี้ประกอบด้วยเมตาดาต้าที่ลิงก์ความหมายเผยแพร่ไปยังสภาพแวดล้อมวิทยาศาสตร์ข้อมูล Synapse เพื่อเปิดใช้งานประสบการณ์ใหม่และรักษาสายข้อมูล
ตัวอย่างแอปพลิเคชันของลิงก์ความหมายประกอบด้วย:
- คําแนะนําอัจฉริยะของฟังก์ชันความหมายในตัว
- การรวมนวัตกรรมสําหรับการเพิ่มข้อมูลด้วยหน่วยวัด Power BI โดยใช้ หน่วยวัดเพิ่มเติม
- เครื่องมือสําหรับ การตรวจสอบ คุณภาพข้อมูลตามความสัมพันธ์ระหว่างตารางและการขึ้นต่อกันของฟังก์ชันการทํางานภายในตาราง
ลิงก์เชิงความหมายเป็นเครื่องมือที่มีประสิทธิภาพซึ่งช่วยให้นักวิเคราะห์ธุรกิจสามารถใช้ข้อมูลได้อย่างมีประสิทธิภาพในสภาพแวดล้อมทางวิทยาศาสตร์ข้อมูลที่ครอบคลุม
การเชื่อมโยงเชิงความหมายช่วยอํานวยความสะดวกในการทํางานร่วมกันอย่างราบรื่นระหว่างนักวิทยาศาสตร์ข้อมูลและนักวิเคราะห์ธุรกิจ โดยไม่จําเป็นต้องเติมตรรกะทางธุรกิจที่ฝังอยู่ใน หน่วยวัด Power BI วิธีนี้ช่วยให้มั่นใจว่าทั้งสองฝ่ายสามารถทํางานได้อย่างมีประสิทธิภาพและมีประสิทธิภาพ เพิ่มศักยภาพของข้อมูลเชิงลึกที่ขับเคลื่อนด้วยข้อมูลของพวกเขา
โครงสร้างข้อมูล FabricDataFrame
FabricDataFrame เป็นโครงสร้างข้อมูลหลักที่ลิงก์เชิงความหมายใช้เพื่อเผยแพร่ข้อมูลความหมายจากแบบจําลองความหมายลงในสภาพแวดล้อมของวิทยาศาสตร์ข้อมูล Synapse
คลาส FabricDataFrame
:
- สนับสนุนการดําเนินการทั้งหมดของ pandas
- คลาสย่อยของ DataFrame ของ pandas และเพิ่มเมตาดาต้า เช่น ข้อมูลความหมายและสายข้อมูล
- แสดงฟังก์ชันความหมายและ วิธีการเพิ่มหน่วยวัด ที่ช่วยให้คุณใช้หน่วยวัด Power BI ในงานวิทยาศาสตร์ข้อมูล