Delen via


Overzicht van LightGBM in SynapseML

LightGBM is een opensource-framework voor gedistribueerde, gedistribueerde, hoogwaardige gradiƫntverhoging (GBDT, GBRT, GBM of MART). Dit framework is gespecialiseerd in het maken van beslissingsstructuuralgoritmen met hoge kwaliteit en GPU voor classificatie, classificatie en vele andere machine learning-taken. LightGBM maakt deel uit van het DMTK-project van Microsoft.

Voordelen van LightGBM

  • Samenstelbaarheid: LightGBM-modellen kunnen worden opgenomen in bestaande SparkML-pijplijnen en worden gebruikt voor batch-, streaming- en serverworkloads.
  • Prestaties: LightGBM op Spark is 10-30% sneller dan SparkML in de Higgs-gegevensset en bereikt een toename van 15% in AUC. Parallelle experimenten hebben gecontroleerd of LightGBM een lineaire snelheid kan bereiken door meerdere machines te gebruiken voor training in specifieke instellingen.
  • Functionaliteit: LightGBM biedt een breed scala aan niet-instelbare parameters, die u kunt gebruiken om hun beslissingsstructuursysteem aan te passen. LightGBM op Spark ondersteunt ook nieuwe typen problemen, zoals kwantielregressie.
  • Platformoverschrijdend: LightGBM op Spark is beschikbaar op Spark, PySpark en SparklyR.

LightGBM-gebruik

  • LightGBMClassifier: gebruikt voor het bouwen van classificatiemodellen. Om bijvoorbeeld te voorspellen of een bedrijf failliet gaat of niet, kunnen we een binair classificatiemodel bouwen met LightGBMClassifier.
  • LightGBMRegressor: wordt gebruikt voor het bouwen van regressiemodellen. Om bijvoorbeeld de woningprijs te voorspellen, kunnen we een regressiemodel bouwen met LightGBMRegressor.
  • LightGBMRanker: gebruikt voor het bouwen van classificatiemodellen. Om bijvoorbeeld de relevantie van zoekresultaten van websites te voorspellen, kunnen we een classificatiemodel maken met LightGBMRanker.