FFM

提出 field-aware 特征域感知的概念,细化隐向量的表示。

  • 每一个特征对应的不再是唯一一个隐向量,而是一组隐向量。

    • (F-1) 个 k 维特征 embedding,同一组内特征不交叉
  • 不同特征之间的交叉和特征域相关,无法通过化简公式减少复杂度。

FFM 引入部分人工特征工程,如果参数量和 FM 一样,有效果差异吗?

FFM 和 FM 区别 #card

  • 提出 field-aware 特征域感知的概念,细化隐向量的表示。
    , FM 中特征与不同类型特征作用只用同一隐向量。

  • 实践中使用 FFM 往往需要人为挑选交叉的对象

FM存在冗余。在原始形式中,每两个特征之间都存在交叉,但其实在实际使用中,这点是没必要的,甚至可能成为一个缺陷。因为FM的点积会让两个交叉的嵌入变得越来越相似,如果不加以控制,那么在优化的过程中会出现矛盾。例子#card

  • 有3个嵌入需要相互交叉:出版商ESPN、商家Nike、性别“男”​。按照FM的设计,如果ESPN和Nike经常一起出现则贡献一个正样本,那么他俩的嵌入距离会接近,因为交互形式是点积,正样本要促使内积的结果增大。同理Nike和“男”同时出现,它们的嵌入也会变得相似。

  • 但是传递下来出现了意料之外的结果,ESPN和“男”的嵌入长得像,这种传递关系就不一定合理了;或者说3个嵌入被捆绑了,互相之间会有拉扯,如果ESPN和“男”的组合在实践中贡献的是负样本,Nike的嵌入又该往哪边走呢?

Ref

作者

Ryen Xiang

发布于

2025-06-07

更新于

2025-06-07

许可协议


网络回响

评论