目标编码

解决 [[One-hot Encoding]] 稀疏问题

[[均值编码]],列中的每一个值换成该类别的均值目标值

  • A: 0.3 A: 0.4 中 A 用 0.35 替换

模型会倾向与拟合所看到的目标编码值

Leave-one-out encoding, leave-me-out

  • 不计算当前行的平均值,弥补对 y 变量的依赖,防止信息泄露

编码中加入正态分布的噪音

[[Ref]]