数据清洗
缺失量较大直接删除特征
少量缺失值处理常用方法 #card
- 自适应层
- 缺失值用 w1
- 如果不是缺失值用 w2*x
- 均值插补
- 同类均值插补
- 建模预测,使用模型对缺失值进行预测
- 高维映射
- 多重插补
- 压缩感知及矩阵补全
对于数值异常,可以使用箱线图观察分析,#card
- 如个别样本特征出现极大值或极小值,可以采用最简单的均值、中位数等填充,
- 或者在数据量级不大的情况下,直接删除存在异常特征的样本。
缺失量较大直接删除特征
少量缺失值处理常用方法 #card
对于数值异常,可以使用箱线图观察分析,#card