lgbm原理 _勵志人生網

LightGBM（Light Gradient Boosting Machine，簡稱LGBM）是一種基於梯度提升決策樹（Gradient Boosted Decision Trees, GBDT）的高效、可擴展的機器學習算法。LGBM旨在解決GBDT算法在處理海量數據時計算效率低下的問題，並通過一系列最佳化策略提升了計算效率，同時幾乎保持了與XGBoost同等的建模效果。LGBM的實際套用效果在很多場景下甚至優於XGBoost，這得益於其提出的最佳化策略，包括但不限於：

基於Histogram的決策樹算法：LGBM使用直方圖算法來加速決策樹的建模過程，這種算法能夠高效地處理經過壓縮的數據，從而提升訓練效率。

互斥特徵捆綁（Exclusive Feature Bundling, EFB）：通過將互斥特徵綁定為一個特徵，LGBM實現了降維，進一步減少了計算負擔。

帶深度限制的Leaf-wise葉子生長策略：與傳統GBDT工具使用的按層生長（level-wise）策略不同，LGBM採用Leaf-wise策略，優先分裂增益較高的葉子節點，避免了不必要的搜尋和分裂開銷。

數據壓縮方法：LGBM的數據壓縮技術能夠在大幅減少實際訓練數據量的同時，保持數據信息的完整性，這對於提升計算效率和模型精度都有積極作用。

儘管LGBM在某些方面做出了「選擇性的犧牲精度」，但這種犧牲實際上有助於抑制模型過擬合，從而在某些情況下獲得更好的模型效果。LGBM的成功在於它不僅繼承了GBDT算法的優點，還通過創新性的最佳化策略，使其成為處理海量數據的頂級算法之一。