Sdílet prostřednictvím


Přehled LightGBM v SynapseML

LightGBM je opensourcový, distribuovaný, vysoce výkonný přechodový nárůst (GBDT, GBRT, GBM nebo MART). Tato architektura se specializuje na vytváření vysoce kvalitních algoritmů rozhodovacího stromu s podporou GPU pro řazení, klasifikaci a řadu dalších úloh strojového učení. LightGBM je součástí projektu DMTK Od Microsoftu.

Výhody LightGBM

  • Kompozičnost: Modely LightGBM je možné začlenit do stávajících kanálů SparkML a použít je k dávkovému streamování a obsluhování úloh.
  • Výkon: LightGBM ve Sparku je o 10–30 % rychlejší než SparkML v datové sadě Higgs a dosahuje 15% nárůstu AUC. Paralelní experimenty ověřily , že LightGBM dokáže dosáhnout lineární zrychlení pomocí několika počítačů pro trénování v konkrétních nastaveních.
  • Funkce: LightGBM nabízí širokou škálu vyladěných parametrů, které lze použít k přizpůsobení systému rozhodovacího stromu. LightGBM ve Sparku také podporuje nové typy problémů, jako je regrese quantile.
  • Multiplatformní prostředí: LightGBM ve Sparku je k dispozici ve Sparku, PySparku a SparklyR.

Využití LightGBM

  • LightGBMClassifier: používá se pro vytváření klasifikačních modelů. Abychom například mohli předpovědět, jestli společnost zbankrotuje nebo ne, mohli bychom vytvořit binární klasifikační model s LightGBMClassifier.
  • LightGBMRegressor: slouží k vytváření regresních modelů. Například k predikci ceny bydlení bychom mohli vytvořit regresní model s LightGBMRegressor.
  • LightGBMRanker: používá se k vytváření modelů řazení. Abychom mohli například předpovědět význam výsledků hledání na webu, můžeme vytvořit model řazení s LightGBMRanker.