行为序列建模

行为序列的时间窗口

  • 短期序列

    • N < 200

    • 聚集在一个或几个类目上

    • 提取出用户的短期兴趣

  • 长期序列

    • 千或万量级

    • 用户长期购物习惯

    • 提取出用户的长期兴趣

  • Session 序列

    • 几分钟或几十分钟访问行为

建模的属性信息

  • 物品 id

  • 物品属性的信息

  • 行为时间

  • 行为类型

  • 行为的详细信息

    • 停留时长、点击图片、查看评论

负反馈

  • 隐式负反馈

    • 曝光未点击
  • 显示负反馈

建模方法

  • [[Pooling]]

    • 行为序列特征 embedding 做 mean, sum 或 max pooling

    • 用户历史序列中的行为有相同的重要程度,反应用户主要兴趣。

    • [[@Deep Neural Networks for YouTube Recommendations]]

  • [[Attention]]

  • RNN

  • [[Capsule]]

    • MIND
  • Transformer

    • DSIN

    • BST

  • 基于记忆网络

    • HPMN

    • MIMN

  • 基于检索的模型

    • UBR4CTR

    • [[SIM]]

[[@日久见人心:论建模用户长期兴趣的几种姿势]]

长期用户行为序列处理模型

  • MIMN、UBR4REC、SIM、ETA、SDIM,每个模型都在解决什么问题,有什么优缺点,注意时间复杂度

    • 比如,SIM用hard search来缩短行为序列长度,但是用于检索的离线索引构建耗时,因此有了不需要构建索引的ETA,但ETA仍然需要[[target attention]],因此有了一步到位的SDIM

参考

作者

Ryen Xiang

发布于

2024-10-05

更新于

2025-01-12

许可协议


网络回响

评论