Přehled LightGBM v SynapseML
LightGBM je opensourcový, distribuovaný, vysoce výkonný přechodový nárůst (GBDT, GBRT, GBM nebo MART). Tato architektura se specializuje na vytváření vysoce kvalitních algoritmů rozhodovacího stromu s podporou GPU pro řazení, klasifikaci a řadu dalších úloh strojového učení. LightGBM je součástí projektu DMTK Od Microsoftu.
Výhody LightGBM
- Kompozičnost: Modely LightGBM je možné začlenit do stávajících kanálů SparkML a použít je k dávkovému streamování a obsluhování úloh.
- Výkon: LightGBM ve Sparku je o 10–30 % rychlejší než SparkML v datové sadě Higgs a dosahuje 15% nárůstu AUC. Paralelní experimenty ověřily , že LightGBM dokáže dosáhnout lineární zrychlení pomocí několika počítačů pro trénování v konkrétních nastaveních.
- Funkce: LightGBM nabízí širokou škálu vyladěných parametrů, které lze použít k přizpůsobení systému rozhodovacího stromu. LightGBM ve Sparku také podporuje nové typy problémů, jako je regrese quantile.
- Multiplatformní prostředí: LightGBM ve Sparku je k dispozici ve Sparku, PySparku a SparklyR.
Využití LightGBM
- LightGBMClassifier: používá se pro vytváření klasifikačních modelů. Abychom například mohli předpovědět, jestli společnost zbankrotuje nebo ne, mohli bychom vytvořit binární klasifikační model s
LightGBMClassifier
. - LightGBMRegressor: slouží k vytváření regresních modelů. Například k predikci ceny bydlení bychom mohli vytvořit regresní model s
LightGBMRegressor
. - LightGBMRanker: používá se k vytváření modelů řazení. Abychom mohli například předpovědět význam výsledků hledání na webu, můžeme vytvořit model řazení s
LightGBMRanker
.