Översikt över LightGBM i SynapseML
LightGBM är ett ramverk med öppen källkod, distribuerad toning med höga prestanda (GBDT, GBRT, GBM eller MART). Det här ramverket är specialiserat på att skapa algoritmer med hög kvalitet och GPU-aktiverade beslutsträd för rangordning, klassificering och många andra maskininlärningsuppgifter. LightGBM är en del av Microsofts DMTK-projekt .
Fördelar med LightGBM
- Sammansättning: LightGBM-modeller kan införlivas i befintliga SparkML-pipelines och användas för batch-, strömnings- och serveringsarbetsbelastningar.
- Prestanda: LightGBM på Spark är 10–30 % snabbare än SparkML på Higgs-datauppsättningen och ökar AUC med 15 %. Parallella experiment har verifierat att LightGBM kan uppnå en linjär snabbhet med hjälp av flera datorer för träning i specifika inställningar.
- Funktioner: LightGBM erbjuder ett brett utbud av justerbara parametrar som man kan använda för att anpassa sitt beslutsträdssystem. LightGBM på Spark stöder också nya typer av problem, till exempel kvantilregression.
- Plattformsoberoende: LightGBM på Spark finns på Spark, PySpark och SparklyR.
LightGBM-användning
- LightGBMClassifier: används för att skapa klassificeringsmodeller. För att till exempel förutsäga om ett företag går i konkurs eller inte kan vi skapa en binär klassificeringsmodell med
LightGBMClassifier
. - LightGBMRegressor: används för att skapa regressionsmodeller. För att till exempel förutsäga bostadspriset kan vi skapa en regressionsmodell med
LightGBMRegressor
. - LightGBMRanker: används för att skapa rankningsmodeller. För att till exempel förutsäga relevansen av sökresultat för webbplatsen kan vi skapa en rangordningsmodell med
LightGBMRanker
.