目标编码
解决 [[One-hot Encoding]] 稀疏问题
[[均值编码]],列中的每一个值换成该类别的均值目标值
- A: 0.3 A: 0.4 中 A 用 0.35 替换
模型会倾向与拟合所看到的目标编码值
Leave-one-out encoding, leave-me-out
- 不计算当前行的平均值,弥补对 y 变量的依赖,防止信息泄露
编码中加入正态分布的噪音
[[Ref]]
解决 [[One-hot Encoding]] 稀疏问题
[[均值编码]],列中的每一个值换成该类别的均值目标值
模型会倾向与拟合所看到的目标编码值
Leave-one-out encoding, leave-me-out
编码中加入正态分布的噪音
[[Ref]]