2026-02-17 2026-02-17 随手记 1 分钟读完 (大约180个字) 0次访问batch 内负采样示意图 #card 优点 #card 缺点是容易造成样本选择偏差(Sample Selection Bias,SSB) #card 这是因为,召回的正样本来自点击数据,而被点击的多是热门物料。 再加上一个Batch的大小有限,其中的热门物料就更加集中,与召回要被应用于整个物料库的数据环境差距较大。 换句话说,Batch内负采样所采集到的负样本都是Hard Negative(大多数用户都喜欢热门物料),缺少与用户兴趣毫不相关的Easy Negative。 网络回响batch 内负采样https://blog.xiang578.com/post/logseq/104927.html作者Ryen Xiang发布于2026-02-17更新于2026-02-17许可协议