第5章 召回
5.2 向量化召回统一建模框架
[[向量召回]] 基本流程 #incremental #card
(1)训练一个模型 $M$ ,将 $Q$ 中的每个实例 $q$ 和T中的每个实例 $t$ 都映射到同一个向量空间。
(2)将T中几十万,上百万个实例喂入模型M,映射成向量。
- 再把这几十万,上百万个向量灌入Faiss或Milvus这样的向量数据库,建立索引。
(3)在线服务时,对于一个Q类的实例 $q$ ,通过模型M将其映射成向量 $\mathbf{E m b}_q$ 。
再在向量数据库中,通过近似最近邻(ANN)搜索算法,查找与 $\mathbf{E m b}q$ 最近的 $K$ 个 $T$ 类的邻居向量 $\mathbf{E m b}{t_i}$ 。
这些邻居向量对应的 $t_i(1 \leqslant i \leqslant K)$ 作为召回结果返回。
5.3 借助 [[Word2Vec]]
5.4 “瑞士军刀”FM的召回功能
部分内容来源于文章 [[fm:推荐算法中的瑞士军刀]]