fm:推荐算法中的瑞士军刀

链接:https://zhuanlan.zhihu.com/p/343174108

排序是特征的意义,而召回是样本,特别是负样本的艺术

关注:样本选择、模型设计、上线部署

精排

  • FM 特征交叉指的是两个特征的共现
    • 统计意义上的交叉:用户的tag和物料的tag之间的重合度
  • 线上服务
    • 用户特征只需要抽取、计算一遍,在给多个 item 打分复用

召回

  • 随机采样得到负样本
    • 曝光未点击能不能做为负样本?
  • 打压热门 item
  • 增强 hard negative
  • 模型迭代训练,上一个版本生成这个版本的 hard negative
  • [[Pair Wise]] user与正样本item的匹配程度,要远远高于,user与负样本item的匹配程度
  • BPR Loss $$sigmod(f(user, item_+) - f(user, item_-))$$
  • 如何将 fm 公式转化成向量匹配

模型解释性

  • [[GBDT]] 全局特征重要性
  • FM 局部特征重要性
    • 特征重要性是客观存在的
    • 特征按 field 聚合得到 embedding,然后计算 field 之间的相关性

网络回响

fm:推荐算法中的瑞士军刀

https://blog.xiang578.com/post/logseq/8251.html

作者

Ryen Xiang

发布于

2026-02-17

更新于

2026-02-17

许可协议


评论