行为序列建模
行为序列的时间窗口
短期序列
N < 200
聚集在一个或几个类目上
提取出用户的短期兴趣
长期序列
千或万量级
用户长期购物习惯
提取出用户的长期兴趣
Session 序列
- 几分钟或几十分钟访问行为
建模的属性信息
物品 id
物品属性的信息
行为时间
行为类型
行为的详细信息
- 停留时长、点击图片、查看评论
负反馈
隐式负反馈
- 曝光未点击
显示负反馈
建模方法
[[Pooling]]
行为序列特征 embedding 做 mean, sum 或 max pooling
用户历史序列中的行为有相同的重要程度,反应用户主要兴趣。
[[@Deep Neural Networks for YouTube Recommendations]]
-
[[DSTN]]
[[DSIN]]
RNN
[[Capsule]]
- MIND
Transformer
DSIN
BST
基于记忆网络
HPMN
MIMN
基于检索的模型
UBR4CTR
[[SIM]]
长期用户行为序列处理模型
MIMN、UBR4REC、SIM、ETA、SDIM,每个模型都在解决什么问题,有什么优缺点,注意时间复杂度
- 比如,SIM用hard search来缩短行为序列长度,但是用于检索的离线索引构建耗时,因此有了不需要构建索引的ETA,但ETA仍然需要[[target attention]],因此有了一步到位的SDIM
参考