ภาพรวมของ LightGBM ใน SynapseML
LightGBM เป็นเฟรมเวิร์กการไล่ระดับสีแบบกระจายและมีประสิทธิภาพสูง (GBDT, GBRT, GBM หรือ MART) เฟรมเวิร์กนี้มีความเชี่ยวชาญในการสร้างอัลกอริทึมทรีการตัดสินใจที่เปิดใช้งาน GPU และคุณภาพสูงสําหรับการจัดอันดับการจําแนกประเภทและงานการเรียนรู้ของเครื่องอื่น ๆ อีกมากมาย LightGBM เป็นส่วนหนึ่งของโครงการ DMTK ของ Microsoft
ข้อดีของ LightGBM
- ความสามารถในการแยกย่อยได้: แบบจําลอง LightGBM สามารถรวมเข้ากับไปป์ไลน์ SparkML ที่มีอยู่และใช้สําหรับชุดงาน สตรีมมิ่ง และให้บริการปริมาณงาน
- ประสิทธิภาพ: LightGBM บน Spark เร็วกว่า Spark 10-30% บน ชุดข้อมูล Higgs และ AUC เพิ่มขึ้น 15% การ ทดลองแบบขนานได้ตรวจสอบว่า LightGBM สามารถเร่งความเร็วแบบเส้นตรงได้โดยใช้เครื่องหลายเครื่องเพื่อการฝึกฝนในการตั้งค่าเฉพาะ
- ฟังก์ชันการทํางาน: LightGBM นําเสนอ พารามิเตอร์ที่ไม่สามารถทํามากมายซึ่งสามารถใช้เพื่อกําหนดระบบต้นไม้ในการตัดสินใจได้ นอกจากนี้ LightGBM บน Spark ยังรองรับปัญหาประเภทใหม่ เช่น การถดถอยของปริมาณข้อมูล
- แพลตฟอร์มข้าม: LightGBM บน Spark มีให้ใช้งานบน Spark, PySpark และ SparklyR
การใช้งาน LightGBM
- ตัวแยกประเภท LightGBM: ใช้สําหรับการสร้างแบบจําลองการจัดประเภท ตัวอย่างเช่น เพื่อคาดการณ์ว่าบริษัทจะล้มละลายหรือไม่ เราสามารถสร้างแบบจําลองการจัดประเภทไบนารีด้วย
LightGBMClassifier
- LightGBMRegressor: ใช้สําหรับการสร้างแบบจําลองการถดถอย ตัวอย่างเช่น หากต้องการคาดการณ์ราคาที่อยู่อาศัย เราสามารถสร้างแบบจําลองการถดถอยด้วย
LightGBMRegressor
ได้ - LightGBMRanker: ใช้สําหรับการสร้างแบบจําลองการจัดอันดับ ตัวอย่างเช่น หากต้องการคาดการณ์ความเกี่ยวข้องของผลลัพธ์การค้นหาเว็บไซต์ เราสามารถสร้างแบบจําลองการจัดอันดับด้วย
LightGBMRanker
ได้