2026-02-172026-02-17 随手记 4 分钟读完 (大约652个字) 0次访问

可解释性

可解释模型

特征重要性

Permutation Importance
- 要某个研究特征的重要性，将特征对应的数据打乱排序，观察 metric 或 loss 变化。如果变化不大，说明该特征重要性低
[[@A Unified Approach to Interpreting Model Predictions]] 通过 SHAP 计算每一个样本中的特征影响力
[[@”Why Should I Trust You?”: Explaining the Predictions of Any Classifier]] LIME 与模型无关的局部可解释。假设非线性模型的局部是近似线性的，用线性模型的权重大小反应对应特征的重要程度。
XGBoost ((dcde4d73-143e-4c5a-a813-012d0f3b0ad6))
- 特征在所有树中做为划分属性的次数
- 特征作为划分属性时 loss 平均的降低量
- 特征作为划分属性时对样本的覆盖度

单特征分析

Partial Dependence Plots 部分依赖图，通过改变部分变量的值而固定其余变量的方式研究部分变量与预测目标的关系。
- 开源工具包 pdpbox，同时改变多个样本的部分变量为相同值，然后求预测结果的平均值。
  - x 是特征取值范围，y 轴代表预测结果。随着特征取值变大，y 逐渐增大然后收敛。