向量召回相关性控制
由于搜索一般有比较明确的query意图,因此通常情况下搜索召回的第一目标是相关性。而很多时候通过DSSM架构虽然可以得到语义泛化的特征表达,但也免不了因语义漂移带来的相关性badcase。#card
-
一方面可以在模型侧增加更多的语义特性(如query/item信息拓展、类目信息)或构造更难的样本等;
-
另一方面可以从策略出发,对向量召回做相应限制,常用的如:
- 限定类目下召回(商品类目在query类目预测集合中)、限定核心term匹配(品牌、型号等关键属性或根据term weighting)、限定向量匹配分阈值等,最终在业务目标和用户体感之间得到平衡。