混合负采样

image.png

  • 额外建立了一个 向量缓存 ,存储物料塔在训练过程中得到的最新的物料向量。

  • 如何采样 #card

    • 在训练每个Batch的时候,先进行Batch内负采样,同一个Batch内两条样本中的物料互为Hard Negative

    • 额外从向量缓存采样一些由物料塔计算好的之前的物料向量 b,作为Easy Negative的Embedding

  • 尽管在一个Batch内热门物料比较集中,但是向量缓存汇集了多个Batch计算出的物料向量,从中还是能够采样到一些小众、冷门物料作为Easy Negative的。所以,混合负采样对物料库的覆盖更加全面,更加符合负样本要让召回模型“开眼界、见世面”的一般原则。

作者

Ryen Xiang

发布于

2025-04-30

更新于

2025-04-30

许可协议


网络回响

评论