fm:推荐算法中的瑞士军刀
链接:https://zhuanlan.zhihu.com/p/343174108
排序是特征的意义,而召回是样本,特别是负样本的艺术
关注:样本选择、模型设计、上线部署
精排
- FM 特征交叉指的是两个特征的共现
- 统计意义上的交叉:用户的tag和物料的tag之间的重合度
- 线上服务
- 用户特征只需要抽取、计算一遍,在给多个 item 打分复用
召回
- 随机采样得到负样本
- 曝光未点击能不能做为负样本?
- 打压热门 item
- 增强 hard negative
- [[@Real-time Personalization using Embeddings for Search Ranking at Airbnb]]
- 正样本同城的房间作为负样本
- 被房主拒绝
- [[@Real-time Personalization using Embeddings for Search Ranking at Airbnb]]
- 模型迭代训练,上一个版本生成这个版本的 hard negative
- [[Pair Wise]] user与正样本item的匹配程度,要远远高于,user与负样本item的匹配程度
- BPR Loss $$sigmod(f(user, item_+) - f(user, item_-))$$
- 如何将 fm 公式转化成向量匹配
模型解释性
- [[GBDT]] 全局特征重要性
- FM 局部特征重要性
- 特征重要性是客观存在的
- 特征按 field 聚合得到 embedding,然后计算 field 之间的相关性
网络回响
fm:推荐算法中的瑞士军刀