การทดลองการเรียนรู้ของเครื่องใน Microsoft Fabric
การทดลองการเรียนรู้ของเครื่องเป็นหน่วยหลักขององค์กรและควบคุมการเรียกใช้การเรียนรู้ของเครื่องที่เกี่ยวข้องทั้งหมด การ เรียกใช้ สอดคล้องกับการดําเนินการเดียวของรหัสแบบจําลอง ใน MLflow การติดตามจะขึ้นอยู่กับการทดลองและการทํางาน
การทดลองการเรียนรู้ของเครื่องช่วยให้นักวิทยาศาสตร์ข้อมูลสามารถบันทึกพารามิเตอร์ เวอร์ชันโค้ด เมตริก และไฟล์ผลลัพธ์เมื่อเรียกใช้โค้ดการเรียนรู้ของเครื่อง นอกจากนี้ การทดลองยังช่วยให้คุณสามารถแสดงภาพ ค้นหา และการเปรียบเทียบการเรียกใช้ รวมถึงดาวน์โหลดไฟล์เรียกใช้และเมตาดาต้าสําหรับการวิเคราะห์ในเครื่องมืออื่น ๆ ได้
ในบทความนี้ คุณจะได้เรียนรู้เพิ่มเติมว่านักวิทยาศาสตร์ข้อมูลสามารถโต้ตอบและใช้การทดลองการเรียนรู้ของเครื่องเพื่อจัดระเบียบกระบวนการพัฒนาของพวกเขาได้อย่างไร และเพื่อติดตามการเรียกใช้หลายรายการ
ข้อกำหนดเบื้องต้น
- การสมัครใช้งาน Power BI Premium ถ้าคุณยังไม่มี ให้ดู วิธีการซื้อ Power BI Premium
- พื้นที่ทํางาน Power BI ที่มีความจุพรีเมียมที่กําหนด
สร้างการทดลอง
คุณสามารถสร้างการทดลองการเรียนรู้ของเครื่องได้โดยตรงจากโฮมเพจวิทยาศาสตร์ข้อมูลในอินเทอร์เฟซผู้ใช้ (UI) ของ Power BI หรือโดยการเขียนโค้ดที่ใช้ API ของ MLflow
สร้างการทดลองโดยใช้ UI
วิธีการสร้างการทดลองการเรียนรู้ของเครื่องจาก UI:
สร้างพื้นที่ทํางานวิทยาศาสตร์ข้อมูลใหม่หรือเลือกพื้นที่ทํางานที่มีอยู่
เลือก การทดลอง จากส่วน "ใหม่"
ใส่ชื่อการทดสอบและเลือก สร้าง การดําเนินการนี้จะสร้างการทดลองที่ว่างเปล่าภายในพื้นที่ทํางานของคุณ
หลังจากสร้างการทดลอง คุณสามารถเริ่มเพิ่มการเรียกใช้เพื่อติดตามเมตริกและพารามิเตอร์การเรียกใช้ได้
สร้างการทดลองโดยใช้ MLflow API
คุณยังสามารถสร้างการทดลองการเรียนรู้ของเครื่องได้โดยตรงจากประสบการณ์การเขียนของคุณโดยใช้ mlflow.create_experiment()
หรือ mlflow.set_experiment()
API ในโค้ดต่อไปนี้ ให้แทนที่ <EXPERIMENT_NAME>
ด้วยชื่อของการทดลองของคุณ
import mlflow
# This will create a new experiment with the provided name.
mlflow.create_experiment("<EXPERIMENT_NAME>")
# This will set the given experiment as the active experiment.
# If an experiment with this name does not exist, a new experiment with this name is created.
mlflow.set_experiment("<EXPERIMENT_NAME>")
จัดการการเรียกใช้ภายในการทดลอง
การทดลองการเรียนรู้ของเครื่องประกอบด้วยคอลเลกชันของการเรียกใช้เพื่อการติดตามและการเปรียบเทียบที่ง่ายดาย ภายในการทดลอง นักวิทยาศาสตร์ข้อมูลสามารถนําทางในการทํางานต่าง ๆ และสํารวจพารามิเตอร์และเมตริกพื้นฐานได้ นักวิทยาศาสตร์ข้อมูลยังสามารถเปรียบเทียบการทํางานภายในการทดลองการเรียนรู้ของเครื่องเพื่อระบุชุดย่อยของพารามิเตอร์ที่ให้ประสิทธิภาพของแบบจําลองที่ต้องการได้
ติดตามการทํางาน
การเรียกใช้การเรียนรู้ของเครื่องสอดคล้องกับการดําเนินการรหัสแบบจําลองเดียว
แต่ละการเรียกใช้ประกอบด้วยข้อมูลต่อไปนี้:
- แหล่งที่มา: ชื่อของสมุดบันทึกที่สร้างการเรียกใช้
- เวอร์ชันที่ลงทะเบียน: ระบุว่าการเรียกใช้ถูกบันทึกเป็นแบบจําลองการเรียนรู้ของเครื่องหรือไม่
- วันที่เริ่มต้น: เวลาเริ่มต้นของการเรียกใช้
- สถานะ: ความคืบหน้าของการเรียกใช้
- Hyperparameters: Hyperparameters บันทึกเป็นคู่ค่าคีย์ ทั้งคีย์และค่าเป็นสตริง
- เมตริก: เรียกใช้เมตริกที่บันทึกไว้เป็นคู่ค่าคีย์ ค่าเป็นตัวเลข
- ไฟล์ผลลัพธ์: ไฟล์เอาต์พุตในรูปแบบใด ๆ ตัวอย่างเช่น คุณสามารถบันทึกรูปภาพ สภาพแวดล้อม แบบจําลอง และไฟล์ข้อมูล
ดูการเรียกใช้ล่าสุด
คุณยังสามารถดูการทํางานล่าสุดสําหรับการทดลองได้โดยตรงจากมุมมองรายการพื้นที่ทํางาน มุมมองนี้ช่วยให้คุณสามารถติดตามกิจกรรมล่าสุดข้ามไปยังแอปพลิเคชัน Spark ที่เกี่ยวข้องและใช้ตัวกรองตามสถานะการเรียกใช้ได้อย่างรวดเร็ว
การเปรียบเทียบและการใช้งานตัวกรอง
เพื่อเปรียบเทียบและประเมินคุณภาพของการเรียกใช้การเรียนรู้ของเครื่องของคุณ คุณสามารถเปรียบเทียบพารามิเตอร์ เมตริก และเมตาดาต้าระหว่างการทํางานที่เลือกภายในการทดลองได้
เปรียบเทียบการเรียกใช้ด้วยภาพ
คุณสามารถเปรียบเทียบและเรียกใช้ตัวกรองแบบมองเห็นได้ภายในการทดลองที่มีอยู่ การเปรียบเทียบวิชวลช่วยให้คุณสามารถนําทางระหว่างการเรียกใช้หลายรายการและเรียงลําดับได้อย่างง่ายดาย
เพื่อเปรียบเทียบการเรียกใช้:
- เลือกการทดสอบการเรียนรู้ของเครื่องที่มีอยู่ซึ่งมีการเรียกใช้หลายรายการ
- เลือก แท็บมุมมอง จากนั้นไปยัง มุมมองรายการ เรียกใช้ อีกวิธีหนึ่งคือ คุณสามารถเลือกตัวเลือกเพื่อดูรายการเรียกใช้โดยตรงจากมุมมองรายละเอียดการเรียกใช้
- กําหนดคอลัมน์ภายในตารางโดยการขยายบานหน้าต่าง กําหนดคอลัมน์ เอง ที่นี่ คุณสามารถเลือกคุณสมบัติ เมตริก และ hyperparameters ที่คุณต้องการดู
- ขยายบานหน้าต่าง ตัวกรอง เพื่อจํากัดผลลัพธ์ของคุณตามเกณฑ์ที่เลือก
- เลือกการเรียกใช้หลายรายการเพื่อเปรียบเทียบผลลัพธ์ในบานหน้าต่างการเปรียบเทียบเมตริก จากบานหน้าต่างนี้ คุณสามารถกําหนดแผนภูมิโดยเปลี่ยนชื่อแผนภูมิ ชนิดการแสดงภาพ แกน X แกน Y และอื่น ๆ ได้
เปรียบเทียบการทํางานโดยใช้ MLflow API
นักวิทยาศาสตร์ข้อมูลยังสามารถใช้ MLflow เพื่อคิวรีและค้นหาระหว่างการเรียกใช้ภายในการทดลองได้ คุณสามารถสํารวจ MLflow API เพิ่มเติมสําหรับการค้นหา การกรอง และการเปรียบเทียบการทํางานได้โดยไปที่ เอกสารประกอบ MLflow
รับการเรียกใช้ทั้งหมด
คุณสามารถใช้ MLflow search API mlflow.search_runs()
เพื่อเรียกใช้ทั้งหมดในการทดลองโดยแทนที่ <EXPERIMENT_NAME>
ชื่อการทดสอบของคุณ หรือ <EXPERIMENT_ID>
ด้วย ID การทดลองของคุณในโค้ดต่อไปนี้:
import mlflow
# Get runs by experiment name:
mlflow.search_runs(experiment_names=["<EXPERIMENT_NAME>"])
# Get runs by experiment ID:
mlflow.search_runs(experiment_ids=["<EXPERIMENT_ID>"])
เคล็ดลับ
คุณสามารถค้นหาการทดลองได้หลายการให้รายการรหัสการทดลองกับ experiment_ids
พารามิเตอร์ ในทํานองเดียวกัน การให้รายการชื่อการทดลองกับ experiment_names
พารามิเตอร์จะช่วยให้ MLflow สามารถค้นหาในหลายการทดลองได้ ซึ่งจะเป็นประโยชน์ถ้าคุณต้องการเปรียบเทียบการทํางานในแบบต่างๆ ภายในการทดลองที่แตกต่างกัน
การเรียกใช้คําสั่งซื้อและขีดจํากัด
max_results
ใช้พารามิเตอร์ จาก search_runs
เพื่อจํากัดจํานวนการเรียกใช้ที่ส่งกลับ พารามิเตอร์ order_by
ช่วยให้คุณสามารถระบุรายการคอลัมน์ที่จะเรียงลําดับตาม และสามารถมีค่า หรือ ASC
ที่เลือกDESC
ได้ ตัวอย่างเช่น ตัวอย่างต่อไปนี้จะแสดงการเรียกใช้ครั้งล่าสุดของการทดสอบ
mlflow.search_runs(experiment_ids=[ "1234-5678-90AB-CDEFG" ], max_results=1, order_by=["start_time DESC"])
เปรียบเทียบการเรียกใช้ภายในโน้ตบุ๊ค Fabric
คุณสามารถใช้วิดเจ็ตการเขียน MLFlow ภายในสมุดบันทึกสําหรับ Fabric เพื่อติดตามการเรียกใช้ MLflow ที่สร้างขึ้นภายในเซลล์ของสมุดบันทึกแต่ละเซลล์ได้ วิดเจ็ตช่วยให้คุณสามารถติดตามการทํางาน เมตริก พารามิเตอร์ และคุณสมบัติที่เกี่ยวข้องไปจนถึงระดับเซลล์แต่ละเซลล์
หากต้องการรับการเปรียบเทียบวิชวล คุณยังสามารถสลับไปยังมุมมอง การเปรียบเทียบการเรียกใช้ มุมมองนี้นําเสนอข้อมูลแบบกราฟิก ซึ่งช่วยในการระบุแบบด่วนของรูปแบบหรือค่าเบี่ยงเบนในการใช้งานที่แตกต่างกัน
บันทึกการเรียกใช้เป็นแบบจําลองการเรียนรู้ของเครื่อง
เมื่อเรียกใช้จะให้ผลลัพธ์ที่ต้องการแล้ว คุณสามารถบันทึกการเรียกใช้เป็นแบบจําลองสําหรับการติดตามแบบจําลองที่ได้รับการปรับปรุงและสําหรับการปรับใช้แบบจําลองโดยการเลือก บันทึกเป็นแบบจําลอง ML