2025-06-072025-06-15 随手记 2 分钟读完 (大约303个字) 0次访问

近似搜索

[[KD 树]] #card

一次搜索都把空间分成两份，然后在其中继续搜索。
在k-d树中，并不能保证沿着某一个分支下去就能得到所有结果，
因此当特征维度升高之后，复杂度也会急剧升高，在现在的搜索方案中一般不会选择。

哈希方法，#card

具体说是局部敏感哈希(Locality Sensitive Hashing,LSH)，
目标是把两个距离较近的高维向量经过哈希映射到一起。

量化方法，是本节的重点之一，#card

先把一些点“捏”成一个团，它们要么一起被选，要么一起被丢弃。
向量量化方法在近几年的主流都是基于乘积量化(Product Quantization,PQ)方法[插图]的，也是开源库[[Faiss]]的实现方法。

基于图的方法，注意这里的“图”和上一节的“图”的区别。在上一节中即使也叫“图”，它主要是一种训练嵌入的方法，这里的“图”是真正按照数据结构本身来搜索的。

近似搜索

https://blog.xiang578.com/post/logseq/近似搜索.html

作者

Ryen Xiang

发布于

2025-06-07

更新于

2025-06-15

许可协议

网络回响

评论