目标编码

解决 [[One-hot Encoding]] 稀疏问题

[[均值编码]],列中的每一个值换成该类别的均值目标值

  • A: 0.3 A: 0.4 中 A 用 0.35 替换

模型会倾向与拟合所看到的目标编码值

Leave-one-out encoding, leave-me-out

  • 不计算当前行的平均值,弥补对 y 变量的依赖,防止信息泄露

编码中加入正态分布的噪音

[[Ref]]

作者

Ryen Xiang

发布于

2024-10-05

更新于

2025-04-06

许可协议


相关文章

网络回响

评论