数据清洗

缺失量较大直接删除特征

少量缺失值处理常用方法 #card

  • 自适应层

    • 缺失值用 w1

    • 如果不是缺失值用 w2*x

  • 均值插补

  • 同类均值插补

  • 建模预测,使用模型对缺失值进行预测

  • 高维映射

  • 多重插补

  • 压缩感知及矩阵补全

对于数值异常,可以使用箱线图观察分析,#card

  • 如个别样本特征出现极大值或极小值,可以采用最简单的均值、中位数等填充,

  • 或者在数据量级不大的情况下,直接删除存在异常特征的样本。

作者

Ryen Xiang

发布于

2025-04-20

更新于

2025-04-20

许可协议


网络回响

评论