LightGBM:n yleiskatsaus SynapseML:ssä
LightGBM on avoimen lähdekoodin hajautettu, suorituskykyinen liukuvärin tehoste (GBDT, GBRT, GBM tai MART) -kehys. Tämä kehys on erikoistunut laadukkaiden ja suoritinkäyttöisten päätöspuu-algoritmien luomiseen luokittelua, luokittelua ja monia muita koneoppimistehtäviä varten. LightGBM on osa Microsoftin DMTK-projektia.
LightGBM:n edut
- Yhdistettävyys: LightGBM-mallit voidaan sisällyttää olemassa oleviin SparkML-putkiin ja käyttää erä-, suoratoisto- ja tarjoilukuormituksille.
- Suorituskyky: LightGBM On Spark on 10-30 % nopeampi kuin SparkML Higgs-tietojoukossa ja sen AUC-arvo kasvaa 15 %. Rinnakkaiset kokeet ovat varmistaneet, että LightGBM voi nopeuttaa lineaarista nopeutta käyttämällä useita koneita tiettyjen asetusten harjoittamiseen.
- Toiminnot: LightGBM tarjoaa laajan valikoiman säädettäviä parametreja, joiden avulla voidaan mukauttaa päätöspuujärjestelmää. LightGBM on Spark tukee myös uudenlaisia ongelmia, kuten määrällista regressiota.
- Eri ympäristö: LightGBM on Spark on saatavilla Sparkissä, PySparkissa ja SparklyR:ssä.
LightGBM-käyttö
- LightGBMClassifier: käytetään luokitusmallien rakentamiseen. Esimerkiksi vararikossa olevan yrityksen vararikon ennustamiseksi voidaan luoda binaariluokitusmalli parametrilla
LightGBMClassifier
. - LightGBMRegressor: käytetään regressiomallien rakentamiseen. Esimerkiksi asumisen hinnan ennustamiseksi voitaisiin luoda regressiomalli :n avulla
LightGBMRegressor
. - LightGBMRanker: käytetään sijoitusmallien rakentamiseen. Esimerkiksi verkkosivuston hakutulosten merkityksen ennustamiseksi voimme luoda sijoitusmallin kohteen avulla
LightGBMRanker
.