第5章 召回
5.2 向量化召回统一建模框架
- [[向量化召回统一建模框架]]
- [[向量召回]] 基本流程 #card
- (1)训练一个模型 $M$ ,将 $Q$ 中的每个实例 $q$ 和T中的每个实例 $t$ 都映射到同一个向量空间。
- (2)将T中几十万,上百万个实例喂入模型M,映射成向量。
- 再把这几十万,上百万个向量灌入Faiss或Milvus这样的向量数据库,建立索引。
- (3)在线服务时,对于一个Q类的实例 $q$ ,通过模型M将其映射成向量 $\mathbf{E m b}_q$ 。
- 再在向量数据库中,通过近似最近邻(ANN)搜索算法,查找与 $\mathbf{E m b}q$ 最近的 $K$ 个 $T$ 类的邻居向量 $\mathbf{E m b}{t_i}$ 。
- 这些邻居向量对应的 $t_i(1 \leqslant i \leqslant K)$ 作为召回结果返回。
5.3 借助 [[Word2Vec]]
- [[Item2Vec]]
- [[@Real-time Personalization using Embeddings for Search Ranking at Airbnb]]
- 阿里巴巴 2018 [[EGES]]
5.4 “瑞士军刀”FM的召回功能
- 部分内容来源于文章 [[fm:推荐算法中的瑞士军刀]]
- [[热门打压]]
- [[batch 内负采样]]
- [[混合负采样]]