fm:推荐算法中的瑞士军刀
链接:https://zhuanlan.zhihu.com/p/343174108
排序是特征的意义,而召回是样本,特别是负样本的艺术
关注:样本选择、模型设计、上线部署
精排
FM 特征交叉指的是两个特征的共现
- 统计意义上的交叉:用户的tag和物料的tag之间的重合度
线上服务
- 用户特征只需要抽取、计算一遍,在给多个 item 打分复用
召回
随机采样得到负样本
- 曝光未点击能不能做为负样本?
打压热门 item
增强 hard negative
[[@Real-time Personalization using Embeddings for Search Ranking at Airbnb]]
正样本同城的房间作为负样本
被房主拒绝
模型迭代训练,上一个版本生成这个版本的 hard negative
[[Pair Wise]] user与正样本item的匹配程度,要远远高于,user与负样本item的匹配程度
BPR Loss $$sigmod(f(user, item_+) - f(user, item_-))$$
如何将 fm 公式转化成向量匹配
模型解释性
[[GBDT]] 全局特征重要性
FM 局部特征重要性
特征重要性是客观存在的
特征按 field 聚合得到 embedding,然后计算 field 之间的相关性