2024-10-05 2025-04-06 随手记 1 分钟读完 (大约141个字)目标编码解决 [[One-hot Encoding]] 稀疏问题 [[均值编码]],列中的每一个值换成该类别的均值目标值 A: 0.3 A: 0.4 中 A 用 0.35 替换 模型会倾向与拟合所看到的目标编码值 Leave-one-out encoding, leave-me-out 不计算当前行的平均值,弥补对 y 变量的依赖,防止信息泄露 编码中加入正态分布的噪音 [[Ref]] Stop One-Hot Encoding Your Categorical Variables. | by Andre Ye | Towards Data Science Feature Engineering
2025-04-20@Towards Personalized and Semantic Retrieval: An End-to-End Solution for E-commerce Search via Embedding Learning随手记