fm:推荐算法中的瑞士军刀

链接:https://zhuanlan.zhihu.com/p/343174108

排序是特征的意义,而召回是样本,特别是负样本的艺术

关注:样本选择、模型设计、上线部署

精排

  • FM 特征交叉指的是两个特征的共现

    • 统计意义上的交叉:用户的tag和物料的tag之间的重合度
  • 线上服务

    • 用户特征只需要抽取、计算一遍,在给多个 item 打分复用

召回

  • 随机采样得到负样本

    • 曝光未点击能不能做为负样本?
  • 打压热门 item

  • 增强 hard negative

  • 模型迭代训练,上一个版本生成这个版本的 hard negative

  • [[Pair Wise]] user与正样本item的匹配程度,要远远高于,user与负样本item的匹配程度

  • BPR Loss $$sigmod(f(user, item_+) - f(user, item_-))$$

  • 如何将 fm 公式转化成向量匹配

模型解释性

  • [[GBDT]] 全局特征重要性

  • FM 局部特征重要性

    • 特征重要性是客观存在的

    • 特征按 field 聚合得到 embedding,然后计算 field 之间的相关性

作者

Ryen Xiang

发布于

2025-06-07

更新于

2025-06-07

许可协议


网络回响

评论