行为序列建模
行为序列的时间窗口
- 短期序列
- N < 200
- 聚集在一个或几个类目上
- 提取出用户的短期兴趣
- 长期序列
- 千或万量级
- 用户长期购物习惯
- 提取出用户的长期兴趣
- Session 序列
- 几分钟或几十分钟访问行为
建模的属性信息
- 物品 id
- 物品属性的信息
- 行为时间
- 行为类型
- 行为的详细信息
- 停留时长、点击图片、查看评论
负反馈
- 隐式负反馈
- 曝光未点击
- 显示负反馈
建模方法
- [[Pooling]]
- 行为序列特征 embedding 做 mean, sum 或 max pooling
- 用户历史序列中的行为有相同的重要程度,反应用户主要兴趣。
- [[@Deep Neural Networks for YouTube Recommendations]]
- [[Attention]]
- [[DIN]]
- [[DSTN]]
- [[DSIN]]
- RNN
- [[Capsule]]
- MIND
- Transformer
- DSIN
- BST
- 基于记忆网络
- HPMN
- MIMN
- 基于检索的模型
- UBR4CTR
- [[SIM]]
长期用户行为序列处理模型
- MIMN、UBR4REC、SIM、ETA、SDIM,每个模型都在解决什么问题,有什么优缺点,注意时间复杂度
- 比如,SIM用hard search来缩短行为序列长度,但是用于检索的离线索引构建耗时,因此有了不需要构建索引的ETA,但ETA仍然需要[[target attention]],因此有了一步到位的SDIM
参考