数据清洗
缺失量较大直接删除特征
少量缺失值处理常用方法 #card
-
自适应层
-
缺失值用 w1
-
如果不是缺失值用 w2*x
-
-
均值插补
-
同类均值插补
-
建模预测,使用模型对缺失值进行预测
-
高维映射
-
多重插补
-
压缩感知及矩阵补全
对于数值异常,可以使用箱线图观察分析,#card
-
如个别样本特征出现极大值或极小值,可以采用最简单的均值、中位数等填充,
-
或者在数据量级不大的情况下,直接删除存在异常特征的样本。
缺失量较大直接删除特征
少量缺失值处理常用方法 #card
自适应层
缺失值用 w1
如果不是缺失值用 w2*x
均值插补
同类均值插补
建模预测,使用模型对缺失值进行预测
高维映射
多重插补
压缩感知及矩阵补全
对于数值异常,可以使用箱线图观察分析,#card
如个别样本特征出现极大值或极小值,可以采用最简单的均值、中位数等填充,
或者在数据量级不大的情况下,直接删除存在异常特征的样本。