2026-02-172026-02-17 随手记 2 分钟读完 (大约263个字) 0次访问

DART

主要思想 → 每次新加的树要拟合并不是之前全部树 ensemble 后的负梯度，而是随机抽取一些树 ensmeble 后的负梯度。

解决 {{c1 GBDT over-specialization}} 问题
- 问题现象 → 前面迭代树对预测值的贡献比较大，后面的树会集中预测一小部分样本的偏差
- 常规方法 → Shrinkage

算法流程图

[[lightgbm 使用记录]] Early stopping is not available in dart mode

DART

Ryen Xiang

2026-02-17

2026-02-17