แชร์ผ่าน


การทดลองการเรียนรู้ของเครื่องใน Microsoft Fabric

การทดลองการเรียนรู้ของเครื่องเป็นหน่วยหลักขององค์กรและควบคุมการเรียกใช้การเรียนรู้ของเครื่องที่เกี่ยวข้องทั้งหมด การ เรียกใช้ สอดคล้องกับการดําเนินการเดียวของรหัสแบบจําลอง ใน MLflow การติดตามจะขึ้นอยู่กับการทดลองและการทํางาน

การทดลองการเรียนรู้ของเครื่องช่วยให้นักวิทยาศาสตร์ข้อมูลสามารถบันทึกพารามิเตอร์ เวอร์ชันโค้ด เมตริก และไฟล์ผลลัพธ์เมื่อเรียกใช้โค้ดการเรียนรู้ของเครื่อง นอกจากนี้ การทดลองยังช่วยให้คุณสามารถแสดงภาพ ค้นหา และการเปรียบเทียบการเรียกใช้ รวมถึงดาวน์โหลดไฟล์เรียกใช้และเมตาดาต้าสําหรับการวิเคราะห์ในเครื่องมืออื่น ๆ ได้

ในบทความนี้ คุณจะได้เรียนรู้เพิ่มเติมว่านักวิทยาศาสตร์ข้อมูลสามารถโต้ตอบและใช้การทดลองการเรียนรู้ของเครื่องเพื่อจัดระเบียบกระบวนการพัฒนาของพวกเขาได้อย่างไร และเพื่อติดตามการเรียกใช้หลายรายการ

ข้อกำหนดเบื้องต้น

  • การสมัครใช้งาน Power BI Premium ถ้าคุณยังไม่มี ให้ดู วิธีการซื้อ Power BI Premium
  • พื้นที่ทํางาน Power BI ที่มีความจุพรีเมียมที่กําหนด

สร้างการทดลอง

คุณสามารถสร้างการทดลองการเรียนรู้ของเครื่องได้โดยตรงจากโฮมเพจวิทยาศาสตร์ข้อมูลในอินเทอร์เฟซผู้ใช้ (UI) ของ Power BI หรือโดยการเขียนโค้ดที่ใช้ API ของ MLflow

สร้างการทดลองโดยใช้ UI

วิธีการสร้างการทดลองการเรียนรู้ของเครื่องจาก UI:

  1. สร้างพื้นที่ทํางานวิทยาศาสตร์ข้อมูลใหม่หรือเลือกพื้นที่ทํางานที่มีอยู่

  2. เลือก การทดลอง จากส่วน "ใหม่"

  3. ใส่ชื่อการทดสอบและเลือก สร้าง การดําเนินการนี้จะสร้างการทดลองที่ว่างเปล่าภายในพื้นที่ทํางานของคุณ

    Screenshot showing where to select Experiment in the New menu.

หลังจากสร้างการทดลอง คุณสามารถเริ่มเพิ่มการเรียกใช้เพื่อติดตามเมตริกและพารามิเตอร์การเรียกใช้ได้

สร้างการทดลองโดยใช้ MLflow API

คุณยังสามารถสร้างการทดลองการเรียนรู้ของเครื่องได้โดยตรงจากประสบการณ์การเขียนของคุณโดยใช้ mlflow.create_experiment() หรือ mlflow.set_experiment() API ในโค้ดต่อไปนี้ ให้แทนที่ <EXPERIMENT_NAME> ด้วยชื่อของการทดลองของคุณ

import mlflow
 
# This will create a new experiment with the provided name.
mlflow.create_experiment("<EXPERIMENT_NAME>")

# This will set the given experiment as the active experiment. 
# If an experiment with this name does not exist, a new experiment with this name is created.
mlflow.set_experiment("<EXPERIMENT_NAME>")

จัดการการเรียกใช้ภายในการทดลอง

การทดลองการเรียนรู้ของเครื่องประกอบด้วยคอลเลกชันของการเรียกใช้เพื่อการติดตามและการเปรียบเทียบที่ง่ายดาย ภายในการทดลอง นักวิทยาศาสตร์ข้อมูลสามารถนําทางในการทํางานต่าง ๆ และสํารวจพารามิเตอร์และเมตริกพื้นฐานได้ นักวิทยาศาสตร์ข้อมูลยังสามารถเปรียบเทียบการทํางานภายในการทดลองการเรียนรู้ของเครื่องเพื่อระบุชุดย่อยของพารามิเตอร์ที่ให้ประสิทธิภาพของแบบจําลองที่ต้องการได้

ติดตามการทํางาน

การเรียกใช้การเรียนรู้ของเครื่องสอดคล้องกับการดําเนินการรหัสแบบจําลองเดียว

Screenshot of machine learning run detail page.

แต่ละการเรียกใช้ประกอบด้วยข้อมูลต่อไปนี้:

  • แหล่งที่มา: ชื่อของสมุดบันทึกที่สร้างการเรียกใช้
  • เวอร์ชันที่ลงทะเบียน: ระบุว่าการเรียกใช้ถูกบันทึกเป็นแบบจําลองการเรียนรู้ของเครื่องหรือไม่
  • วันที่เริ่มต้น: เวลาเริ่มต้นของการเรียกใช้
  • สถานะ: ความคืบหน้าของการเรียกใช้
  • Hyperparameters: Hyperparameters บันทึกเป็นคู่ค่าคีย์ ทั้งคีย์และค่าเป็นสตริง
  • เมตริก: เรียกใช้เมตริกที่บันทึกไว้เป็นคู่ค่าคีย์ ค่าเป็นตัวเลข
  • ไฟล์ผลลัพธ์: ไฟล์เอาต์พุตในรูปแบบใด ๆ ตัวอย่างเช่น คุณสามารถบันทึกรูปภาพ สภาพแวดล้อม แบบจําลอง และไฟล์ข้อมูล

ดูการเรียกใช้ล่าสุด

คุณยังสามารถดูการทํางานล่าสุดสําหรับการทดลองได้โดยตรงจากมุมมองรายการพื้นที่ทํางาน มุมมองนี้ช่วยให้คุณสามารถติดตามกิจกรรมล่าสุดข้ามไปยังแอปพลิเคชัน Spark ที่เกี่ยวข้องและใช้ตัวกรองตามสถานะการเรียกใช้ได้อย่างรวดเร็ว

Screenshot of machine learning recent runs and Spark application view.

การเปรียบเทียบและการใช้งานตัวกรอง

เพื่อเปรียบเทียบและประเมินคุณภาพของการเรียกใช้การเรียนรู้ของเครื่องของคุณ คุณสามารถเปรียบเทียบพารามิเตอร์ เมตริก และเมตาดาต้าระหว่างการทํางานที่เลือกภายในการทดลองได้

เปรียบเทียบการเรียกใช้ด้วยภาพ

คุณสามารถเปรียบเทียบและเรียกใช้ตัวกรองแบบมองเห็นได้ภายในการทดลองที่มีอยู่ การเปรียบเทียบวิชวลช่วยให้คุณสามารถนําทางระหว่างการเรียกใช้หลายรายการและเรียงลําดับได้อย่างง่ายดาย

Screenshot showing a list of runs and the chart view.

เพื่อเปรียบเทียบการเรียกใช้:

  1. เลือกการทดสอบการเรียนรู้ของเครื่องที่มีอยู่ซึ่งมีการเรียกใช้หลายรายการ
  2. เลือก แท็บมุมมอง จากนั้นไปยัง มุมมองรายการ เรียกใช้ อีกวิธีหนึ่งคือ คุณสามารถเลือกตัวเลือกเพื่อดูรายการเรียกใช้โดยตรงจากมุมมองรายละเอียดการเรียกใช้
  3. กําหนดคอลัมน์ภายในตารางโดยการขยายบานหน้าต่าง กําหนดคอลัมน์ เอง ที่นี่ คุณสามารถเลือกคุณสมบัติ เมตริก และ hyperparameters ที่คุณต้องการดู
  4. ขยายบานหน้าต่าง ตัวกรอง เพื่อจํากัดผลลัพธ์ของคุณตามเกณฑ์ที่เลือก
  5. เลือกการเรียกใช้หลายรายการเพื่อเปรียบเทียบผลลัพธ์ในบานหน้าต่างการเปรียบเทียบเมตริก จากบานหน้าต่างนี้ คุณสามารถกําหนดแผนภูมิโดยเปลี่ยนชื่อแผนภูมิ ชนิดการแสดงภาพ แกน X แกน Y และอื่น ๆ ได้

เปรียบเทียบการทํางานโดยใช้ MLflow API

นักวิทยาศาสตร์ข้อมูลยังสามารถใช้ MLflow เพื่อคิวรีและค้นหาระหว่างการเรียกใช้ภายในการทดลองได้ คุณสามารถสํารวจ MLflow API เพิ่มเติมสําหรับการค้นหา การกรอง และการเปรียบเทียบการทํางานได้โดยไปที่ เอกสารประกอบ MLflow

รับการเรียกใช้ทั้งหมด

คุณสามารถใช้ MLflow search API mlflow.search_runs() เพื่อเรียกใช้ทั้งหมดในการทดลองโดยแทนที่ <EXPERIMENT_NAME> ชื่อการทดสอบของคุณ หรือ <EXPERIMENT_ID> ด้วย ID การทดลองของคุณในโค้ดต่อไปนี้:

import mlflow

# Get runs by experiment name: 
mlflow.search_runs(experiment_names=["<EXPERIMENT_NAME>"])

# Get runs by experiment ID:
mlflow.search_runs(experiment_ids=["<EXPERIMENT_ID>"])

เคล็ดลับ

คุณสามารถค้นหาการทดลองได้หลายการให้รายการรหัสการทดลองกับ experiment_ids พารามิเตอร์ ในทํานองเดียวกัน การให้รายการชื่อการทดลองกับ experiment_names พารามิเตอร์จะช่วยให้ MLflow สามารถค้นหาในหลายการทดลองได้ ซึ่งจะเป็นประโยชน์ถ้าคุณต้องการเปรียบเทียบการทํางานในแบบต่างๆ ภายในการทดลองที่แตกต่างกัน

การเรียกใช้คําสั่งซื้อและขีดจํากัด

max_resultsใช้พารามิเตอร์ จาก search_runs เพื่อจํากัดจํานวนการเรียกใช้ที่ส่งกลับ พารามิเตอร์ order_by ช่วยให้คุณสามารถระบุรายการคอลัมน์ที่จะเรียงลําดับตาม และสามารถมีค่า หรือ ASC ที่เลือกDESCได้ ตัวอย่างเช่น ตัวอย่างต่อไปนี้จะแสดงการเรียกใช้ครั้งล่าสุดของการทดสอบ

mlflow.search_runs(experiment_ids=[ "1234-5678-90AB-CDEFG" ], max_results=1, order_by=["start_time DESC"])

เปรียบเทียบการเรียกใช้ภายในโน้ตบุ๊ค Fabric

คุณสามารถใช้วิดเจ็ตการเขียน MLFlow ภายในสมุดบันทึกสําหรับ Fabric เพื่อติดตามการเรียกใช้ MLflow ที่สร้างขึ้นภายในเซลล์ของสมุดบันทึกแต่ละเซลล์ได้ วิดเจ็ตช่วยให้คุณสามารถติดตามการทํางาน เมตริก พารามิเตอร์ และคุณสมบัติที่เกี่ยวข้องไปจนถึงระดับเซลล์แต่ละเซลล์

หากต้องการรับการเปรียบเทียบวิชวล คุณยังสามารถสลับไปยังมุมมอง การเปรียบเทียบการเรียกใช้ มุมมองนี้นําเสนอข้อมูลแบบกราฟิก ซึ่งช่วยในการระบุแบบด่วนของรูปแบบหรือค่าเบี่ยงเบนในการใช้งานที่แตกต่างกัน

Screenshot showing how to use the MLFlow authoring widget.

บันทึกการเรียกใช้เป็นแบบจําลองการเรียนรู้ของเครื่อง

เมื่อเรียกใช้จะให้ผลลัพธ์ที่ต้องการแล้ว คุณสามารถบันทึกการเรียกใช้เป็นแบบจําลองสําหรับการติดตามแบบจําลองที่ได้รับการปรับปรุงและสําหรับการปรับใช้แบบจําลองโดยการเลือก บันทึกเป็นแบบจําลอง ML

Screenshot showing where to select Create a new model.