2024-11-272025-04-23 随手记 5 分钟读完 (大约745个字) 0次访问

@搜推算法常见面试问题第一期：序列建模

1 序列都有哪些组织方式，序列哪些特征是重要的？如何判断新增序列的有效性及收敛情况？如果实际序列小于最大长度，如何padding是最合理的？#card
2[[搜推算法的序列建模需要做self-attention吗？]]
3⃣️ 长序列在什么场景下提升会更大？长序列一般的建模方式有哪些？#card

长序列在任何场景的提升都很大吧。。。重要资源够，
长序列的方式有硬建模sim和soft的方式，
- sim就是舍弃序列中和打分商品类目不一样的商品，缩短序列长度减少计算量，
- soft的方式有很多fancy的论文，比如eta，cta

4⃣️ 在Attention计算的过程中，Mutli-head机制起到了什么作用，能否举例说明？#card

5⃣️ 序列建模在用户冷启场景下，没有用户行为有什么好的解决办法吗？#card

6⃣️ 相对NLP/CV等任务通常多层Transformer的堆叠，搜推往往只有一层，为什么这么操作？#card

7⃣️ 序列建模与GNN有什么区别？序列做宽/深分别在什么场景下收益比较大？#card

做Target Attention的时候如果KV只使用部分序列的特征有什么优劣？#card

target attention是q去和k match，再去乘 v的值，q和k只用部分特征会导致match的不够准吧，v只用部分特征会导致只提取序列里一部分的兴趣

9 [[序列建模可以建模联合概率吗]]？即P（target｜trigger1，trigger2）#card

10 序列建模与传统的协同过滤在建模上的优劣分别有哪些？#card

@搜推算法常见面试问题第一期：序列建模

Ryen Xiang

2024-11-27

2025-04-23

网络回响