Jaa


LightGBM:n yleiskatsaus SynapseML:ssä

LightGBM on avoimen lähdekoodin hajautettu, suorituskykyinen liukuvärin tehoste (GBDT, GBRT, GBM tai MART) -kehys. Tämä kehys on erikoistunut laadukkaiden ja suoritinkäyttöisten päätöspuu-algoritmien luomiseen luokittelua, luokittelua ja monia muita koneoppimistehtäviä varten. LightGBM on osa Microsoftin DMTK-projektia.

LightGBM:n edut

  • Yhdistettävyys: LightGBM-mallit voidaan sisällyttää olemassa oleviin SparkML-putkiin ja käyttää erä-, suoratoisto- ja tarjoilukuormituksille.
  • Suorituskyky: LightGBM On Spark on 10-30 % nopeampi kuin SparkML Higgs-tietojoukossa ja sen AUC-arvo kasvaa 15 %. Rinnakkaiset kokeet ovat varmistaneet, että LightGBM voi nopeuttaa lineaarista nopeutta käyttämällä useita koneita tiettyjen asetusten harjoittamiseen.
  • Toiminnot: LightGBM tarjoaa laajan valikoiman säädettäviä parametreja, joiden avulla voidaan mukauttaa päätöspuujärjestelmää. LightGBM on Spark tukee myös uudenlaisia ongelmia, kuten määrällista regressiota.
  • Eri ympäristö: LightGBM on Spark on saatavilla Sparkissä, PySparkissa ja SparklyR:ssä.

LightGBM-käyttö

  • LightGBMClassifier: käytetään luokitusmallien rakentamiseen. Esimerkiksi vararikossa olevan yrityksen vararikon ennustamiseksi voidaan luoda binaariluokitusmalli parametrilla LightGBMClassifier.
  • LightGBMRegressor: käytetään regressiomallien rakentamiseen. Esimerkiksi asumisen hinnan ennustamiseksi voitaisiin luoda regressiomalli :n avulla LightGBMRegressor.
  • LightGBMRanker: käytetään sijoitusmallien rakentamiseen. Esimerkiksi verkkosivuston hakutulosten merkityksen ennustamiseksi voimme luoda sijoitusmallin kohteen avulla LightGBMRanker.