Udostępnij za pośrednictwem


Omówienie usługi LightGBM w usłudze SynapseML

LightGBM to platforma typu open source, rozproszona, zwiększająca gradient o wysokiej wydajności (GBDT, GBRT, GBM lub MART). Ta struktura specjalizuje się w tworzeniu algorytmów drzewa decyzyjnego z obsługą wysokiej jakości i procesora GPU na potrzeby klasyfikowania, klasyfikacji i wielu innych zadań uczenia maszynowego. LightGBM jest częścią projektu DMTK firmy Microsoft.

Zalety lightGBM

  • Komponowanie: modele LightGBM można włączyć do istniejących potoków SparkML i używać ich do obsługi obciążeń wsadowych, przesyłanych strumieniowo i obsługujących.
  • Wydajność: funkcja LightGBM na platformie Spark jest o 10–30% szybsza niż sparkML w zestawie danych Higgs i osiąga 15% wzrost liczby jednostek AUC. Eksperymenty równoległe zweryfikowały, że lightGBM może osiągnąć szybkość liniową przy użyciu wielu maszyn do trenowania w określonych ustawieniach.
  • Funkcjonalność: LightGBM oferuje szeroką gamę parametrów dostrajania, których można użyć do dostosowania systemu drzewa decyzyjnego. Funkcja LightGBM na platformie Spark obsługuje również nowe typy problemów, takich jak regresja kwantylu.
  • Międzyplatformowa: aplikacja LightGBM na platformie Spark jest dostępna na platformie Spark, PySpark i SparklyR.

Użycie lightGBM

  • LightGBMClassifier: używany do tworzenia modeli klasyfikacji. Aby na przykład przewidzieć, czy firma bankrutuje, czy nie, możemy utworzyć binarny model klasyfikacji za pomocą polecenia LightGBMClassifier.
  • LightGBMRegressor: używany do tworzenia modeli regresji. Na przykład aby przewidzieć cenę mieszkań, możemy utworzyć model regresji za pomocą polecenia LightGBMRegressor.
  • LightGBMRanker: służy do tworzenia modeli klasyfikacji. Aby na przykład przewidzieć istotność wyników wyszukiwania w witrynie internetowej, możemy utworzyć model klasyfikacji za pomocą polecenia LightGBMRanker.