Übersicht über LightGBM in SynapseML
LightGBM ist ein verteiltes Open-Source-Framework mit hochleistungsfähigem Gradient Boosting (GBDT, GBRT, GBM oder MART). Dieses Framework ist auf das Erstellen qualitativ hochwertiger und GPU-fähiger Entscheidungsstrukturalgorithmen zum Bewerten und Klassifizieren sowie für viele weitere Aufgaben in Bezug auf maschinelles Lernen spezialisiert. LightGBM ist Teil des DMTK-Projekts von Microsoft.
Vorteile von LightGBM
- Kombinierbarkeit: LightGBM-Modelle können mit vorhandenen SparkML-Pipelines integriert und für Batch-, Streaming- und Bereitstellungsworkloads verwendet werden.
- Leistung: LightGBM in Spark ist 10 bis 30 % schneller als SparkML im Higgs-Dataset und erreicht eine Erhöhung der AUC um 15 %. Parallele Experimente haben bestätigt, dass LightGBM eine lineare Beschleunigung erreichen kann, indem mehrere Computer für das Training in bestimmten Umgebungen verwendet werden.
- Funktionalität: LightGBM bietet eine breite Palette von anpassbaren Parametern, die zum Einstellen des Entscheidungsstruktursystems verwendet werden können. LightGBM in Spark hilft auch bei neuen Arten von Problemen wie der Quantilregression.
- Plattformübergreifend: LightGBM in Spark ist für Spark, PySpark und SparklyR verfügbar.
Verwenden von LightGBM
- LightGBMClassifier: Wird zum Erstellen von Klassifizierungsmodellen verwendet. Um beispielsweise vorherzusagen, ob ein Unternehmen bankrott geht oder nicht, könnten Sie mit
LightGBMClassifier
ein binäres Klassifizierungsmodell erstellen. - LightGBMRegressor: Wird zum Erstellen von Regressionsmodellen verwendet. Um beispielsweise den Immobilienpreis vorherzusagen, könnten Sie mit
LightGBMRegressor
ein Regressionsmodell erstellen. - LightGBMRanker: Wird zum Erstellen von Bewertungsmodellen verwendet. Um beispielsweise die Relevanz von Websitesuchergebnissen vorherzusagen, könnten Sie mit
LightGBMRanker
ein Bewertungsmodell erstellen.