第5章 召回

5.2 向量化召回统一建模框架

  • [[向量化召回统一建模框架]]

  • [[向量召回]] 基本流程 #incremental #card

    • (1)训练一个模型 $M$ ,将 $Q$ 中的每个实例 $q$ 和T中的每个实例 $t$ 都映射到同一个向量空间。

    • (2)将T中几十万,上百万个实例喂入模型M,映射成向量。

      • 再把这几十万,上百万个向量灌入Faiss或Milvus这样的向量数据库,建立索引。
    • (3)在线服务时,对于一个Q类的实例 $q$ ,通过模型M将其映射成向量 $\mathbf{E m b}_q$ 。

      • 再在向量数据库中,通过近似最近邻(ANN)搜索算法,查找与 $\mathbf{E m b}q$ 最近的 $K$ 个 $T$ 类的邻居向量 $\mathbf{E m b}{t_i}$ 。

      • 这些邻居向量对应的 $t_i(1 \leqslant i \leqslant K)$ 作为召回结果返回。

5.3 借助 [[Word2Vec]]

5.4 “瑞士军刀”FM的召回功能

作者

Ryen Xiang

发布于

2025-06-07

更新于

2025-06-07

许可协议


网络回响

评论