粗排
前期融合和后期融合 #card
前期融合:先对所有特征做 concatenation, 再输入神经网络。
- 线上推理代价大:如果有 𝑛 篇候选笔记,整 个大模型要做 𝑛 次推理。
后期融合:把用户、物品特征分别输入不同的神经 网络,不对用户、物品特征做融合。
线上计算量小:
用户塔只需要做一次线上推理,计算用户表征 𝐚。
物品表征 𝐛 事先储存在向量数据库中,物品塔在线 上不做推理。
粗排模型和精排相比需要考虑的问题 #card
1、模型需要兼顾计算性能和效果;
2、打分样本空间分布与精排不一致(精排对粗排返回的样本做排序,粗排则要对召回的样本打分)
静态分排序
ssb 问题
[[粗排样本选择]] #card
正样本:精排曝光点击
hard neg: 精排曝光未点击
mid neg:精排未曝光
easy neg: 没有进入精排,一般全局随机采样