การล็อกอัตโนมัติใน Microsoft Fabric
Synapse Data Science ใน Microsoft Fabric รวมถึงการล็อกอัตโนมัติซึ่งจะช่วยลดจํานวนโค้ดที่จําเป็นในการบันทึกพารามิเตอร์ เมตริก และรายการของแบบจําลองการเรียนรู้ของเครื่องในระหว่างการฝึกอบรมโดยอัตโนมัติ บทความนี้อธิบายการล็อกอัตโนมัติสําหรับ Synapse Data Science ใน Microsoft Fabric
การล็อกอัตโนมัติขยาย ความสามารถในการติดตาม กระแส ML และผสานรวมเข้ากับวิทยาศาสตร์ข้อมูล Synapse ใน Microsoft Fabric อย่างลึกซึ้ง การบันทึกอัตโนมัติสามารถจับภาพเมตริกต่าง ๆ รวมถึงความแม่นยํา การสูญเสีย คะแนน F1 และเมตริกที่กําหนดเองที่คุณกําหนด นักพัฒนาซอฟต์แวร์และนักวิทยาศาสตร์ข้อมูลสามารถติดตามและเปรียบเทียบประสิทธิภาพของแบบจําลองและการทดลองที่แตกต่างกันได้อย่างง่ายดายโดยไม่ต้องติดตามด้วยตนเอง
เฟรมเวิร์กที่รองรับ
การล็อกอัตโนมัติสนับสนุนเฟรมเวิร์กการเรียนรู้ของเครื่องที่หลากหลาย รวมถึง TensorFlow, PyTorch, Scikit-learn และ XGBoost หากต้องการเรียนรู้เพิ่มเติมเกี่ยวกับคุณสมบัติเฉพาะของเฟรมเวิร์กที่บันทึกโดยอัตโนมัติ โปรดดูเอกสาร MLflow
การตั้งค่าคอนฟิก
การล็อกอัตโนมัติทํางานโดยการจับค่าของพารามิเตอร์อินพุต เมตริกผลลัพธ์ และรายการผลลัพธ์ของแบบจําลองการเรียนรู้ของเครื่องโดยอัตโนมัติขณะที่กําลังได้รับการฝึก ข้อมูลนี้จะถูกบันทึกไปยังพื้นที่ทํางาน Microsoft Fabric ของคุณ ซึ่งคุณสามารถเข้าถึงและแสดงภาพได้โดยใช้ API ของ MLflow หรือรายการการทดลองและแบบจําลองที่สอดคล้องกันในพื้นที่ทํางาน Microsoft Fabric ของคุณ
เมื่อคุณเปิดใช้งานสมุดบันทึก Synapse Data Science แล้ว Microsoft Fabric จะเรียกใช้ mlflow.autolog() เพื่อเปิดใช้งานการติดตามและโหลดการขึ้นต่อกันที่เกี่ยวข้องทันที เมื่อคุณฝึกแบบจําลองในสมุดบันทึกของคุณ MLflow จะติดตามข้อมูลแบบจําลองนี้โดยอัตโนมัติ
การกําหนดค่าเกิดขึ้นเบื้องหลังโดยอัตโนมัติเมื่อคุณเรียกใช้import mlflow
การกําหนดค่าเริ่มต้นสําหรับ mlflow.autolog() hook ของสมุดบันทึกคือ:
mlflow.autolog(
log_input_examples=False,
log_model_signatures=True,
log_models=True,
disable=False,
exclusive=True,
disable_for_unsupported_versions=True,
silent=True
)
การกำหนดเอง
หากต้องการกําหนดลักษณะการทํางานการบันทึก เอง คุณสามารถใช้การกําหนดค่า mlflow.autolog() ได้ การกําหนดค่านี้มีพารามิเตอร์เพื่อเปิดใช้งานการบันทึกแบบจําลอง รวบรวมตัวอย่างการป้อนข้อมูล กําหนดค่าคําเตือน หรือเปิดใช้งานการบันทึกสําหรับเนื้อหาที่เพิ่มที่คุณระบุ
ติดตามเมตริก พารามิเตอร์ และคุณสมบัติเพิ่มเติม
สําหรับการเรียกใช้ที่สร้างขึ้นด้วย MLflow ให้อัปเดตการกําหนดค่าการบันทึกอัตโนมัติของ MLflow เพื่อติดตามเมตริก พารามิเตอร์ ไฟล์ และเมตาดาต้าเพิ่มเติมดังนี้:
อัปเดตการเรียก mlflow.autolog() เพื่อตั้งค่า
exclusive=False
mlflow.autolog( log_input_examples=False, log_model_signatures=True, log_models=True, disable=False, exclusive=False, # Update this property to enable custom logging disable_for_unsupported_versions=True, silent=True )
ใช้ API การติดตาม MLflow เพื่อบันทึกพารามิเตอร์และเมตริกเพิ่มเติม โค้ดตัวอย่างต่อไปนี้ช่วยให้คุณสามารถบันทึกเมตริกและพารามิเตอร์แบบกําหนดเองของคุณควบคู่ไปกับคุณสมบัติเพิ่มเติมได้
import mlflow mlflow.autolog(exclusive=False) with mlflow.start_run(): mlflow.log_param("parameter name", "example value") # <add model training code here> mlflow.log_metric("metric name", 20)
ปิดใช้งานการล็อกโดยอัตโนมัติของ Microsoft Fabric
คุณสามารถปิดใช้งานการล็อกโดยอัตโนมัติของ Microsoft Fabric สําหรับเซสชันสมุดบันทึกที่เฉพาะเจาะจง คุณยังสามารถปิดใช้งานการล็อกอัตโนมัติในสมุดบันทึกทั้งหมดได้โดยใช้การตั้งค่าพื้นที่ทํางาน
หมายเหตุ
หากปิดใช้งานการล็อกอัตโนมัติ คุณต้องบันทึกพารามิเตอร์และเมทริกซ์ของคุณด้วยตนเองโดยใช้ API ของ MLflow
ปิดใช้งานการล็อกอัตโนมัติสําหรับเซสชันสมุดบันทึก
เมื่อต้องการปิดใช้งานการล็อกโดยอัตโนมัติของ Microsoft Fabric สําหรับเซสชันสมุดบันทึกที่เฉพาะเจาะจง ให้เรียกใช้ mlflow.autolog() และตั้งค่าdisable=True
import mlflow
mlflow.autolog(disable=True)
ปิดใช้งานการล็อกอัตโนมัติสําหรับสมุดบันทึกและเซสชันทั้งหมด
ผู้ดูแลระบบพื้นที่ทํางานสามารถเปิดหรือปิดใช้งานการล็อกอัตโนมัติของ Microsoft Fabric สําหรับสมุดบันทึกและเซสชันทั้งหมดในพื้นที่ทํางานของพวกเขาโดยใช้การตั้งค่าพื้นที่ทํางาน เมื่อต้องการเปิดใช้งานหรือปิดใช้งานการล็อกอัตโนมัติของ Synapse Data Science:
ในพื้นที่ทํางาน Synapse Data Science ของคุณ ให้เลือก การตั้งค่าพื้นที่ทํางาน
บนหน้าจอ การตั้งค่าพื้นที่ทํางาน ให้ขยาย วิศวกรข้อมูล ing/วิทยาศาสตร์ บนแถบนําทางด้านซ้ายและเลือก การตั้งค่า Spark
บนหน้าจอ การตั้งค่า Spark เลือกแท็บ บันทึก อัตโนมัติ
ตั้งค่า ติดตามการทดลองและแบบจําลองการเรียนรู้ของเครื่องโดยอัตโนมัติเป็น เปิดหรือปิด
เลือก บันทึก