คําศัพท์สําหรับ Microsoft Fabric
เรียนรู้คําจํากัดความของคําศัพท์ที่ใช้ใน Microsoft Fabric รวมถึงคําศัพท์เฉพาะสําหรับ Fabric Data Warehouse, Fabric Data Engineering, Fabric Data Science, Real-Time Intelligence, Data Factory และ Power BI
ข้อกําหนดทั่วไป
ความจุ : ความจุ คือ ชุดทรัพยากรเฉพาะที่พร้อมใช้งานในเวลาที่กําหนดที่จะใช้ ความจุจะกําหนดความสามารถของทรัพยากรในการดําเนินการกิจกรรมหรือเพื่อสร้างเอาต์พุต รายการต่าง ๆ ใช้ความจุที่แตกต่างกันในบางช่วงเวลา ผ้ามีความจุผ่าน Fabric SKU และการทดลองใช้ สําหรับข้อมูลเพิ่มเติม โปรดดู ความจุคืออะไร
ประสบการณ์ : คอลเลกชันของความสามารถที่กําหนดเป้าหมายไปยังฟังก์ชันการทํางานที่เฉพาะเจาะจง ประสบการณ์การใช้งาน Fabric ประกอบด้วย Fabric Data Warehouse, Fabric Data Engineering, Fabric Data Science, Real-Time Intelligence, Data Factory และ Power BI
รายการ: รายการ ชุดความสามารถภายในประสบการณ์การใช้งาน ผู้ใช้สามารถสร้าง แก้ไข และลบรายการเหล่านั้นได้ หน่วยข้อมูลแต่ละชนิดมีความสามารถแตกต่างกัน ตัวอย่างเช่น ประสบการณ์การใช้งานวิศวกรรมข้อมูลประกอบไปด้วยเลคเฮ้าส์ สมุดบันทึก และรายการข้อกําหนดงาน Spark
ผู้เช่า: ผู้เช่าคืออินสแตนซ์เดียวของ Fabric สําหรับองค์กร และสอดคล้องกับรหัส Microsoft Entra
พื้นที่ทํางาน: พื้นที่ทํางาน เป็นคอลเลกชันของรายการที่รวบรวมฟังก์ชันการทํางานที่แตกต่างกันในสภาพแวดล้อมเดียวที่ออกแบบมาสําหรับการทํางานร่วมกัน ซึ่งทําหน้าที่เป็นคอนเทนเนอร์ที่ใช้ความจุสําหรับงานที่ดําเนินการและมีการควบคุมว่าใครสามารถเข้าถึงรายการในนั้นได้ ตัวอย่างเช่น ในพื้นที่ทํางาน ผู้ใช้สร้างรายงาน สมุดบันทึก แบบจําลองความหมาย ฯลฯ สําหรับข้อมูลเพิ่มเติม โปรดดูบทความ พื้นที่ทํางาน
วิศวกรรมข้อมูลผ้า
Lakehouse: a lakehouse เป็นคอลเลกชันของไฟล์ โฟลเดอร์ และตารางที่แสดงฐานข้อมูลผ่าน data lake ที่โปรแกรม Apache Spark ใช้และเครื่องมือ SQL สําหรับการประมวลผลข้อมูลขนาดใหญ่ เลคเฮ้าส์รวมถึงความสามารถที่เพิ่มขึ้นสําหรับธุรกรรม ACID เมื่อใช้ตารางที่มีการจัดรูปแบบ Delta แบบโอเพนซอร์ส รายการ lakehouse ถูกโฮสต์ไว้ภายในโฟลเดอร์พื้นที่ทํางานที่ไม่ซ้ํากันใน Microsoft OneLake ซึ่งประกอบด้วยไฟล์ในรูปแบบต่าง ๆ (มีโครงสร้างและไม่มีโครงสร้าง) จัดระเบียบในโฟลเดอร์และโฟลเดอร์ย่อย สําหรับข้อมูลเพิ่มเติม โปรดดู เลคเฮาส์คืออะไร
Notebook: A Fabric notebook เป็นเครื่องมือการเขียนโปรแกรมแบบโต้ตอบหลายภาษาพร้อมฟังก์ชันที่สมบูรณ์ ซึ่งรวมถึงการเขียนโค้ดและ Markdown การเรียกใช้และการตรวจสอบงาน Spark การดูและการแสดงภาพผลลัพธ์ และการทํางานร่วมกันกับทีม ซึ่งช่วยให้วิศวกรข้อมูลและนักวิทยาศาสตร์ข้อมูลสามารถสํารวจและประมวลผลข้อมูล และสร้างการทดลองการเรียนรู้ของเครื่องด้วยประสบการณ์การใช้งานทั้งโค้ดและรหัสต่ํา ซึ่งสามารถแปลงเป็นกิจกรรมไปป์ไลน์สําหรับ orchestration ได้อย่างง่ายดาย
แอปพลิเคชัน Spark: แอปพลิเคชัน Apache Spark เป็นโปรแกรมที่เขียนโดยผู้ใช้โดยใช้ภาษา API ของ Spark หนึ่งในภาษา (Scala, Python, Spark SQL หรือ Java) หรือภาษาที่เพิ่มโดย Microsoft (.NET กับ C# หรือ F#) เมื่อแอปพลิเคชันทํางาน แอปพลิเคชันจะถูกแบ่งออกเป็นงาน Spark อย่างน้อยหนึ่งงานที่ทํางานควบคู่ไปกับการประมวลผลข้อมูลได้รวดเร็วยิ่งขึ้น สําหรับข้อมูลเพิ่มเติม โปรดดู การตรวจสอบแอปพลิเคชัน Spark
งาน Apache Spark: งาน Spark เป็นส่วนหนึ่งของแอปพลิเคชัน Spark ที่ทํางานควบคู่ไปกับงานอื่น ๆ ในแอปพลิเคชัน งานประกอบด้วยหลายงาน สําหรับข้อมูลเพิ่มเติม โปรดดู การตรวจสอบงานSpark
ข้อกําหนดงาน Apache Spark: ข้อกําหนดงาน Spark คือชุดของพารามิเตอร์ที่ตั้งค่าโดยผู้ใช้ซึ่งระบุว่าควรเรียกใช้แอปพลิเคชัน Spark อย่างไร ซึ่งช่วยให้คุณสามารถส่งชุดงานหรือสตรีมมิ่งงานไปยังคลัสเตอร์ Spark สําหรับข้อมูลเพิ่มเติม โปรดดู ข้อกําหนดงาน Apache Spark คืออะไร
V-order: การเพิ่มประสิทธิภาพการเขียนเป็นรูปแบบไฟล์ parquet ที่ช่วยให้สามารถอ่านได้อย่างรวดเร็วและให้ประสิทธิภาพค่าใช้จ่ายและประสิทธิภาพที่ดีขึ้น กลไก Fabric ทั้งหมดเขียนไฟล์ parquet แบบ v-ordered ตามค่าเริ่มต้น
โรงงานข้อมูล
Connector: Data Factory มีชุดตัวเชื่อมต่อมากมายที่ช่วยให้คุณสามารถเชื่อมต่อกับที่เก็บข้อมูลประเภทต่างๆ ได้ เมื่อเชื่อมต่อแล้ว คุณสามารถแปลงข้อมูลได้ สําหรับข้อมูลเพิ่มเติม ให้ดู ตัวเชื่อมต่อ
ไปป์ไลน์ข้อมูล: ใน Data Factory ไปป์ไลน์ข้อมูลจะใช้สําหรับการประเคนการเคลื่อนย้ายข้อมูลและการแปลง ไปป์ไลน์เหล่านี้แตกต่างจากไปป์ไลน์การปรับใช้ใน Fabric สําหรับข้อมูลเพิ่มเติม โปรดดู ไปป์ไลน์ ในภาพรวม Data Factory
Dataflow Gen2: กระแสข้อมูลมีส่วนติดต่อที่มีรหัสต่ําสําหรับการนําเข้าข้อมูลจากแหล่งข้อมูลหลายร้อยรายการและแปลงข้อมูลของคุณ กระแสข้อมูลใน Fabric เรียกว่ากระแสข้อมูล Gen2 มีกระแสข้อมูลรุ่น 1 อยู่ใน Power BI กระแสข้อมูล Gen2 มีความสามารถพิเศษเมื่อเทียบกับกระแสข้อมูลใน Azure Data Factory หรือ Power BI คุณไม่สามารถอัปเกรดจาก Gen1 เป็น Gen2 ได้ สําหรับข้อมูลเพิ่มเติม โปรดดู กระแสข้อมูล ในภาพรวม Data Factory
ทริกเกอร์ : ความสามารถอัตโนมัติใน Data Factory ที่เริ่มต้นไปป์ไลน์ตามเงื่อนไขเฉพาะ เช่น กําหนดการหรือความพร้อมใช้งานข้อมูล
วิทยาศาสตร์ข้อมูลสิ่งทอ
Data Wrangler: Data Wrangler เป็นเครื่องมือที่ใช้สมุดบันทึกที่มอบประสบการณ์การใช้งานอันดื่มด่ําให้แก่ผู้ใช้เพื่อดําเนินการวิเคราะห์ข้อมูลแบบสํารวจ คุณลักษณะนี้รวมการแสดงผลข้อมูลที่คล้ายกับตารางด้วยสถิติสรุปแบบไดนามิกและชุดของการดําเนินการล้างข้อมูลทั่วไปที่พร้อมใช้งานกับไอคอนที่เลือกไม่กี่รายการ การดําเนินการแต่ละรายการจะสร้างโค้ดที่สามารถบันทึกกลับไปยังสมุดบันทึกให้เป็นสคริปต์ที่นํามาใช้ใหม่ได้
การทดลอง : การทดลองการเรียนรู้ของเครื่องเป็นหน่วยหลักขององค์กรและการควบคุมสําหรับการเรียกใช้การเรียนรู้ของเครื่องที่เกี่ยวข้องทั้งหมด สําหรับข้อมูลเพิ่มเติม โปรดดู การทดลองการเรียนรู้ของเครื่องใน Microsoft Fabric
แบบจําลอง : แบบจําลองการเรียนรู้ของเครื่องเป็นไฟล์ที่ได้รับการฝึกฝนให้จดจํารูปแบบบางประเภท คุณฝึกแบบจําลองผ่านชุดข้อมูลและคุณให้ข้อมูลด้วยอัลกอริทึมที่ใช้เพื่อเหตุผลและเรียนรู้จากชุดข้อมูลนั้น สําหรับข้อมูลเพิ่มเติม โปรดดู แบบจําลองการเรียนรู้ของเครื่อง
เรียกใช้: การเรียกใช้ สอดคล้องกับการดําเนินการเดียวของโค้ดแบบจําลอง ใน MLflow การติดตามจะขึ้นอยู่กับการทดลองและการเรียกใช้
คลังข้อมูลผ้า
จุดสิ้นสุดการวิเคราะห์ SQL: เลคเฮ้าส์แต่ละแห่งมีจุดสิ้นสุดการวิเคราะห์ SQL ที่อนุญาตให้ผู้ใช้คิวรีข้อมูลตาราง delta ด้วย TSQL บน TDS สําหรับข้อมูลเพิ่มเติม โปรดดู ปลายทางการวิเคราะห์ SQL
Fabric Data Warehouse: ฟังก์ชัน Fabric Data Warehouse เป็นคลังข้อมูลแบบดั้งเดิมและสนับสนุนความสามารถในการทํารายการ T-SQL เต็มรูปแบบที่คุณคาดหวังจากคลังข้อมูลองค์กร สําหรับข้อมูลเพิ่มเติม โปรดดู คลังข้อมูล Fabric
ข่าวกรอง Real-Time
Activator: Activator เป็นเครื่องมือที่ไม่มีรหัสและมีรหัสน้อยที่ช่วยให้คุณสามารถสร้างการแจ้งเตือน ทริกเกอร์ และการดําเนินการบนข้อมูลของคุณ Activator ถูกใช้เพื่อสร้างการแจ้งเตือนบนสตรีมข้อมูลของคุณ สําหรับข้อมูลเพิ่มเติม ให้ดูที่ Activator
Eventhouse: Eventhouses มีโซลูชันสําหรับการจัดการและวิเคราะห์ข้อมูลจํานวนมาก โดยเฉพาะอย่างยิ่งในสถานการณ์ที่ต้องการการวิเคราะห์และการสํารวจแบบเรียลไทม์ ซึ่งออกแบบมาเพื่อจัดการสตรีมข้อมูลแบบเรียลไทม์ได้อย่างมีประสิทธิภาพ ซึ่งช่วยให้องค์กรสามารถนําเข้า ประมวลผล และวิเคราะห์ข้อมูลได้ใกล้เคียงกับเวลาจริง พื้นที่ทํางานเดียวสามารถจัดเก็บอีเวนต์เฮ้าส์ได้หลายแห่ง และคลังเหตุการณ์สามารถเก็บฐานข้อมูล KQL ได้หลายฐานข้อมูล และแต่ละฐานข้อมูลสามารถเก็บหลายตารางได้ สําหรับข้อมูลเพิ่มเติม โปรดดู ภาพรวมของ Eventhouse
Eventstream: คุณลักษณะเหตุการณ์ของ Microsoft Fabric มีพื้นที่ส่วนกลางในแพลตฟอร์ม Fabric เพื่อจับภาพ แปลง และกําหนดเส้นทางเหตุการณ์แบบเรียลไทม์ไปยังปลายทางที่มีประสบการณ์ที่ไม่มีรหัส เหตุการณ์จะประกอบด้วยแหล่งข้อมูลการสตรีมต่างๆ ปลายทางการนําเข้า และตัวประมวลผลเหตุการณ์เมื่อจําเป็นต้องมีการแปลงข้อมูล สําหรับข้อมูลเพิ่มเติม โปรดดู เหตุการณ์สตรีมของ Microsoft Fabric
ฐานข้อมูล KQL: ฐานข้อมูล KQL เก็บข้อมูลในรูปแบบที่คุณสามารถดําเนินการคิวรี KQL ได้ ฐานข้อมูล KQL เป็นรายการภายใต้อีเวนต์เฮ้าส์ สําหรับข้อมูลเพิ่มเติม ให้ดูที่ ฐานข้อมูล KQL
คิวรี KQL: คิวรี KQL คือรายการที่ใช้ในการเรียกใช้คิวรี ดูผลลัพธ์ และจัดการผลลัพธ์คิวรีบนข้อมูลจากฐานข้อมูล Data Explorer ของคุณ ชุดคิวรีประกอบด้วยฐานข้อมูลและตาราง คิวรี และผลลัพธ์ KQL Queryset ช่วยให้คุณสามารถบันทึกคิวรีสําหรับการใช้งานในอนาคต หรือส่งออกและแชร์คิวรีกับผู้อื่นได้ สําหรับข้อมูลเพิ่มเติม โปรดดู ข้อมูลคิวรีใน คิวรี KQL
ฮับ Real-Time
- ฮับ Real-Time: ฮับ Real-Time คือที่เดียวสําหรับข้อมูลทั้งหมดในการเคลื่อนไหวทั่วทั้งองค์กรของคุณ ผู้เช่า Microsoft Fabric ทั้งหมดจะถูกเตรียมใช้งานโดยอัตโนมัติด้วยฮับ สําหรับข้อมูลเพิ่มเติม โปรดดูภาพรวมของฮับ Real-Time
OneLake
- ทางลัด : ทางลัด คือการอ้างอิงแบบฝังตัวภายใน OneLake ที่ชี้ไปยังตําแหน่งจัดเก็บไฟล์อื่น พวกเขาให้วิธีการเชื่อมต่อกับข้อมูลที่มีอยู่โดยไม่ต้องคัดลอกโดยตรง สําหรับข้อมูลเพิ่มเติม โปรดดู ทางลัด OneLake
เนื้อหาที่เกี่ยวข้อง
- นําทางไปยังรายการของคุณจากโฮมเพจ Microsoft Fabric
- บทช่วยสอนแบบครอบคลุมของ ใน Microsoft Fabric