Oversikt over LightGBM i SynapseML
LightGBM er et rammeverk med åpen kildekode, distribuert gradering med høy ytelse (GBDT, GBRT, GBM eller MART). Dette rammeverket spesialiserer seg på å opprette algoritmer av høy kvalitet og GPU-aktiverte beslutningstre for rangering, klassifisering og mange andre maskinlæringsoppgaver. LightGBM er en del av Microsofts DMTK-prosjekt .
Fordeler med LightGBM
- Komponerbarhet: LightGBM-modeller kan innlemmes i eksisterende SparkML-datasamlebånd og brukes til batch, strømming og servering av arbeidsbelastninger.
- Ytelse: LightGBM på Spark er 10–30 % raskere enn SparkML på Higgs-datasettet og oppnår en økning på 15 % i AUC. Parallelle eksperimenter har bekreftet at LightGBM kan oppnå en lineær hastighet ved hjelp av flere maskiner for opplæring i bestemte innstillinger.
- Funksjonalitet: LightGBM tilbyr et bredt utvalg av tunable parametere, som man kan bruke til å tilpasse beslutningstresystemet. LightGBM på Spark støtter også nye typer problemer, for eksempel quantile regresjon.
- Kryssplattform: LightGBM på Spark er tilgjengelig på Spark, PySpark og SparklyR.
LightGBM-bruk
- LightGBMClassifier: brukes til å bygge klassifiseringsmodeller. Hvis du for eksempel vil forutsi om et firma går konkurs eller ikke, kan vi bygge en binær klassifiseringsmodell med
LightGBMClassifier
. - LightGBMRegressor: brukes til å bygge regresjonsmodeller. Hvis du for eksempel vil forutsi boligpris, kan vi bygge en regresjonsmodell med
LightGBMRegressor
. - LightGBMRanker: brukes til å bygge rangeringsmodeller. Hvis du for eksempel vil forutsi relevansen av søkeresultatene for nettstedet, kan vi bygge en rangeringsmodell med
LightGBMRanker
.