2026-02-17 2026-02-17 随手记 1 分钟读完 (大约169个字) 0次访问数据清洗缺失量较大直接删除特征 少量缺失值处理常用方法 #card 自适应层 缺失值用 w1 如果不是缺失值用 w2*x 均值插补 同类均值插补 建模预测,使用模型对缺失值进行预测 高维映射 多重插补 压缩感知及矩阵补全 对于数值异常,可以使用箱线图观察分析,#card 如个别样本特征出现极大值或极小值,可以采用最简单的均值、中位数等填充, 或者在数据量级不大的情况下,直接删除存在异常特征的样本。 网络回响数据清洗https://blog.xiang578.com/post/logseq/78041.html作者Ryen Xiang发布于2026-02-17更新于2026-02-17许可协议