คําศัพท์สําหรับ Microsoft Fabric
เรียนรู้ข้อกําหนดของคําศัพท์ที่ใช้ใน Microsoft Fabric รวมถึงคําศัพท์เฉพาะสําหรับ Fabric Data Warehouse, Fabric วิศวกรข้อมูล ing, Fabric Data Science, Real-Time Intelligence, Data Factory และ Power BI
ข้อกําหนดทั่วไป
ความจุ: ความจุคือชุดทรัพยากรเฉพาะที่พร้อมใช้งานในเวลาที่กําหนดที่จะใช้ ความจุจะกําหนดความสามารถของทรัพยากรในการดําเนินการกิจกรรมหรือเพื่อสร้างเอาต์พุต รายการต่าง ๆ ใช้ความจุที่แตกต่างกันในบางช่วงเวลา ผ้ามีความจุผ่าน Fabric SKU และการทดลองใช้ สําหรับข้อมูลเพิ่มเติม ให้ดู ความจุคืออะไร
ประสบการณ์: คอลเลกชันของความสามารถที่กําหนดเป้าหมายไปยังฟังก์ชันการทํางานที่เฉพาะเจาะจง ประสบการณ์การใช้งาน Fabric ประกอบด้วย Fabric Data Warehouse, Fabric วิศวกรข้อมูล ing, Fabric Data Science, Real-Time Intelligence, Data Factory และ Power BI
รายการ: ชุดความสามารถภายในประสบการณ์ ผู้ใช้สามารถสร้าง แก้ไข และลบรายการเหล่านั้นได้ หน่วยข้อมูลแต่ละชนิดมีความสามารถแตกต่างกัน ตัวอย่างเช่น ประสบการณ์วิศวกรข้อมูลประกอบด้วยเลคเฮาส์ สมุดบันทึก และรายการข้อกําหนดงาน Spark
ผู้เช่า: ผู้เช่าคืออินสแตนซ์เดียวของ Fabric สําหรับองค์กรและสอดคล้องกับรหัส Microsoft Entra
พื้นที่ทํางาน: พื้นที่ทํางานเป็นคอลเลกชันของรายการที่รวบรวมฟังก์ชันการทํางานที่แตกต่างกันในสภาพแวดล้อมเดียวที่ออกแบบมาสําหรับการทํางานร่วมกัน ซึ่งทําหน้าที่เป็นคอนเทนเนอร์ที่ใช้ความจุสําหรับงานที่ดําเนินการและมีการควบคุมว่าใครสามารถเข้าถึงรายการในนั้นได้ ตัวอย่างเช่น ในพื้นที่ทํางาน ผู้ใช้สร้างรายงาน สมุดบันทึก แบบจําลองความหมาย ฯลฯ สําหรับข้อมูลเพิ่มเติม ดูบทความพื้นที่ทํางาน
การวิศวกรข้อมูลผ้า
เลคเฮ้าส์: เลคเฮ้าส์ เป็นคอลเลกชันของไฟล์ โฟลเดอร์ และตารางที่แสดงฐานข้อมูลผ่าน data lake ที่ใช้โดยกลไก Apache Spark และกลไกจัดการ SQL สําหรับการประมวลผลข้อมูลขนาดใหญ่ เลคเฮ้าส์รวมถึงความสามารถที่เพิ่มขึ้นสําหรับธุรกรรม ACID เมื่อใช้ตารางที่มีการจัดรูปแบบ Delta แบบโอเพนซอร์ส รายการ lakehouse ถูกโฮสต์ไว้ภายในโฟลเดอร์พื้นที่ทํางานที่ไม่ซ้ํากันใน Microsoft OneLake ซึ่งประกอบด้วยไฟล์ในรูปแบบต่าง ๆ (มีโครงสร้างและไม่มีโครงสร้าง) จัดระเบียบในโฟลเดอร์และโฟลเดอร์ย่อย สําหรับข้อมูลเพิ่มเติม โปรดดู ที่ เลคเฮ้าส์คืออะไร
โน้ตบุ๊ค: โน้ตบุ๊ค Fabric เป็นเครื่องมือการเขียนโปรแกรมแบบโต้ตอบหลายภาษาพร้อมฟังก์ชั่นที่สมบูรณ์ ซึ่งรวมถึงการเขียนโค้ดและ Markdown การเรียกใช้และการตรวจสอบงาน Spark การดูและการแสดงภาพผลลัพธ์ และการทํางานร่วมกันกับทีม ซึ่งช่วยให้วิศวกรข้อมูลและนักวิทยาศาสตร์ข้อมูลสามารถสํารวจและประมวลผลข้อมูล และสร้างการทดลองการเรียนรู้ของเครื่องด้วยประสบการณ์การใช้งานทั้งโค้ดและรหัสต่ํา ซึ่งสามารถแปลงเป็นกิจกรรมไปป์ไลน์สําหรับ orchestration ได้อย่างง่ายดาย
แอปพลิเคชัน Spark: แอปพลิเคชัน Apache Spark เป็นโปรแกรมที่เขียนโดยผู้ใช้โดยใช้หนึ่งในภาษา API ของ Spark (Scala, Python, Spark SQL หรือ Java) หรือภาษาที่เพิ่มโดย Microsoft (.NET ด้วย C# หรือ F#) เมื่อแอปพลิเคชันทํางาน แอปพลิเคชันจะถูกแบ่งออกเป็นงาน Spark อย่างน้อยหนึ่งงานที่ทํางานควบคู่ไปกับการประมวลผลข้อมูลได้รวดเร็วยิ่งขึ้น สําหรับข้อมูลเพิ่มเติม ให้ดู การตรวจสอบแอปพลิเคชัน Spark
งาน Apache Spark: งาน Spark เป็นส่วนหนึ่งของแอปพลิเคชัน Spark ที่เรียกใช้ควบคู่ไปกับงานอื่น ๆ ในแอปพลิเคชัน งานประกอบด้วยหลายงาน สําหรับข้อมูลเพิ่มเติม ให้ดู การตรวจสอบงาน Spark
ข้อกําหนดงาน Apache Spark: ข้อกําหนดงาน Spark คือชุดพารามิเตอร์ที่กําหนดโดยผู้ใช้ ซึ่งระบุว่าควรเรียกใช้แอปพลิเคชัน Spark อย่างไร ซึ่งช่วยให้คุณสามารถส่งชุดงานหรือสตรีมมิ่งงานไปยังคลัสเตอร์ Spark สําหรับข้อมูลเพิ่มเติม ให้ดู ข้อกําหนดงาน Apache Spark คืออะไร
V-order: การปรับให้เหมาะสมสําหรับการเขียนในรูปแบบไฟล์ parquet ที่ช่วยให้สามารถอ่านได้อย่างรวดเร็วและมีประสิทธิภาพด้านต้นทุนและประสิทธิภาพที่ดีขึ้น กลไก Fabric ทั้งหมดเขียนไฟล์ parquet แบบ v-ordered ตามค่าเริ่มต้น
คลังข้อมูล
ตัวเชื่อมต่อ: Data Factory มีชุดตัวเชื่อมต่อที่หลากหลายที่ช่วยให้คุณสามารถเชื่อมต่อกับที่เก็บข้อมูลประเภทต่างๆ ได้ เมื่อเชื่อมต่อแล้ว คุณสามารถแปลงข้อมูลได้ สําหรับข้อมูลเพิ่มเติม ดู ตัวเชื่อมต่อ
ไปป์ไลน์ข้อมูล: ใน Data Factory จะใช้ไปป์ไลน์ข้อมูลสําหรับการเรียงการเคลื่อนย้ายและการแปลงข้อมูล ไปป์ไลน์เหล่านี้แตกต่างจากไปป์ไลน์การปรับใช้ใน Fabric สําหรับข้อมูลเพิ่มเติม ดู ไปป์ไลน์ ในภาพรวม Data Factory
กระแสข้อมูล Gen2: กระแสข้อมูลมีอินเทอร์เฟซที่มีรหัสต่ําสําหรับการนําเข้าข้อมูลจากแหล่งข้อมูลหลายร้อยแหล่งและแปลงข้อมูลของคุณ กระแสข้อมูลใน Fabric เรียกว่ากระแสข้อมูล Gen2 มีกระแสข้อมูลรุ่น 1 อยู่ใน Power BI กระแสข้อมูล Gen2 มีความสามารถพิเศษเมื่อเทียบกับกระแสข้อมูลใน Azure Data Factory หรือ Power BI คุณไม่สามารถอัปเกรดจาก Gen1 เป็น Gen2 ได้ สําหรับข้อมูลเพิ่มเติม โปรดดู กระแส ข้อมูลในภาพรวม Data Factory
ทริกเกอร์: ความสามารถอัตโนมัติใน Data Factory ที่เริ่มต้นไปป์ไลน์ตามเงื่อนไขเฉพาะ เช่น กําหนดการหรือความพร้อมใช้งานของข้อมูล
วิทยาศาสตร์ข้อมูลสิ่งทอ
Data Wrangler: Data Wrangler เป็นเครื่องมือบนสมุดบันทึกที่มอบประสบการณ์การใช้งานอันดื่มด่ําในการดําเนินการวิเคราะห์ข้อมูลแบบสํารวจ คุณลักษณะนี้รวมการแสดงผลข้อมูลที่คล้ายกับตารางด้วยสถิติสรุปแบบไดนามิกและชุดของการดําเนินการล้างข้อมูลทั่วไปที่พร้อมใช้งานกับไอคอนที่เลือกไม่กี่รายการ การดําเนินการแต่ละรายการจะสร้างโค้ดที่สามารถบันทึกกลับไปยังสมุดบันทึกให้เป็นสคริปต์ที่นํามาใช้ใหม่ได้
การทดลอง: การทดลองการเรียนรู้ของเครื่องเป็นหน่วยหลักขององค์กรและควบคุมการเรียกใช้การเรียนรู้ของเครื่องที่เกี่ยวข้องทั้งหมด สําหรับข้อมูลเพิ่มเติม โปรดดู การทดลองการเรียนรู้ของเครื่องใน Microsoft Fabric
แบบจําลอง: แบบจําลองการเรียนรู้ของเครื่องเป็นไฟล์ที่ได้รับการฝึกฝนเพื่อจดจํารูปแบบบางประเภท คุณฝึกแบบจําลองผ่านชุดข้อมูลและคุณให้ข้อมูลด้วยอัลกอริทึมที่ใช้เพื่อเหตุผลและเรียนรู้จากชุดข้อมูลนั้น สําหรับข้อมูลเพิ่มเติม ให้ดู แบบจําลองการเรียนรู้ของเครื่อง
เรียกใช้: การเรียกใช้ที่สอดคล้องกับการดําเนินการของโค้ดแบบจําลองเดียว ใน MLflow การติดตามจะขึ้นอยู่กับการทดลองและการทํางาน
คลังข้อมูลผ้า
จุดสิ้นสุดการวิเคราะห์ SQL: เลคเฮ้าส์แต่ละแห่งมีจุดสิ้นสุดการวิเคราะห์ SQL ที่ช่วยให้ผู้ใช้สามารถคิวรีข้อมูลตาราง delta ด้วย TSQL บน TDS ได้ สําหรับข้อมูลเพิ่มเติม โปรดดู จุดสิ้นสุดการวิเคราะห์ SQL
Fabric Data Warehouse: ฟังก์ชัน Fabric Data Warehouse เป็นคลังข้อมูลแบบดั้งเดิมและสนับสนุนความสามารถ T-SQL เชิงธุรกรรมเต็มรูปแบบที่คุณคาดหวังจากคลังข้อมูลองค์กร สําหรับข้อมูลเพิ่มเติม ดู ที่คลังข้อมูล Fabric
ระบบอัจฉฉริยะในเวลาจริง
Activator: Activator เป็นเครื่องมือที่ไม่มีรหัสและมีรหัสน้อยที่ช่วยให้คุณสามารถสร้างการแจ้งเตือน ทริกเกอร์ และการดําเนินการบนข้อมูลของคุณ Activator ถูกใช้เพื่อสร้างการแจ้งเตือนบนสตรีมข้อมูลของคุณ สําหรับข้อมูลเพิ่มเติม ดู Activator
Eventhouse: Eventhouses มีโซลูชันสําหรับการจัดการและวิเคราะห์ข้อมูลปริมาณมาก โดยเฉพาะอย่างยิ่งในสถานการณ์ที่ต้องใช้การวิเคราะห์และการสํารวจแบบเรียลไทม์ ซึ่งออกแบบมาเพื่อจัดการสตรีมข้อมูลแบบเรียลไทม์ได้อย่างมีประสิทธิภาพ ซึ่งช่วยให้องค์กรสามารถนําเข้า ประมวลผล และวิเคราะห์ข้อมูลได้ใกล้เคียงกับเวลาจริง พื้นที่ทํางานเดียวสามารถจัดเก็บอีเวนต์เฮ้าส์ได้หลายแห่ง และคลังเหตุการณ์สามารถเก็บฐานข้อมูล KQL ได้หลายฐานข้อมูล และแต่ละฐานข้อมูลสามารถเก็บหลายตารางได้ สําหรับข้อมูลเพิ่มเติม ให้ดู ภาพรวมอีเวนต์เฮ้าส์
เหตุการณ์: คุณลักษณะเหตุการณ์ของ Microsoft Fabric มีพื้นที่ส่วนกลางในแพลตฟอร์ม Fabric เพื่อจับภาพ แปลง และกําหนดเส้นทางเหตุการณ์แบบเรียลไทม์ไปยังปลายทางที่มีประสบการณ์แบบไม่มีรหัส เหตุการณ์จะประกอบด้วยแหล่งข้อมูลการสตรีมต่างๆ ปลายทางการนําเข้า และตัวประมวลผลเหตุการณ์เมื่อจําเป็นต้องมีการแปลงข้อมูล สําหรับข้อมูลเพิ่มเติม ดู เหตุการณ์เหตุการณ์ของ Microsoft Fabric
ฐานข้อมูล KQL: ฐานข้อมูล KQL เก็บข้อมูลในรูปแบบที่คุณสามารถดําเนินการคิวรี KQL ได้ ฐานข้อมูล KQL เป็นรายการภายใต้อีเวนต์เฮ้าส์ สําหรับข้อมูลเพิ่มเติม ดู ฐานข้อมูล KQL
ชุดคิวรี KQL: คิวรี KQL คือรายการที่ใช้ในการเรียกใช้คิวรี ดูผลลัพธ์ และจัดการผลลัพธ์คิวรีบนข้อมูลจากฐานข้อมูล Data Explorer ของคุณ ชุดคิวรีประกอบด้วยฐานข้อมูลและตาราง คิวรี และผลลัพธ์ KQL Queryset ช่วยให้คุณสามารถบันทึกคิวรีสําหรับการใช้งานในอนาคต หรือส่งออกและแชร์คิวรีกับผู้อื่นได้ สําหรับข้อมูลเพิ่มเติม ดูข้อมูล คิวรีในชุดคิวรี KQL
ฮับในเวลาจริง
- ฮับแบบเรียลไทม์: ฮับแบบเรียลไทม์เป็นที่เดียวสําหรับข้อมูลทั้งหมดในการเคลื่อนไหวทั่วทั้งองค์กรของคุณ ผู้เช่า Microsoft Fabric ทั้งหมดจะถูกเตรียมใช้งานโดยอัตโนมัติด้วยฮับ สําหรับข้อมูลเพิ่มเติม โปรดดู ภาพรวมฮับแบบเรียลไทม์
OneLake
- ทางลัด: ทางลัดคือการอ้างอิงแบบฝังตัวภายใน OneLake ที่ชี้ไปยังตําแหน่งจัดเก็บไฟล์อื่น พวกเขาให้วิธีการเชื่อมต่อกับข้อมูลที่มีอยู่โดยไม่ต้องคัดลอกโดยตรง สําหรับข้อมูลเพิ่มเติม ให้ดู ทางลัด OneLake