混合负采样
-
额外建立了一个 向量缓存 ,存储物料塔在训练过程中得到的最新的物料向量。
-
如何采样 #card
-
在训练每个Batch的时候,先进行Batch内负采样,同一个Batch内两条样本中的物料互为Hard Negative
-
额外从向量缓存采样一些由物料塔计算好的之前的物料向量 b,作为Easy Negative的Embedding
-
-
尽管在一个Batch内热门物料比较集中,但是向量缓存汇集了多个Batch计算出的物料向量,从中还是能够采样到一些小众、冷门物料作为Easy Negative的。所以,混合负采样对物料库的覆盖更加全面,更加符合负样本要让召回模型“开眼界、见世面”的一般原则。