RAG的面试问题:embedding、reranker、向量数据库

张开发
2026/4/3 21:48:23 15 分钟阅读
RAG的面试问题:embedding、reranker、向量数据库
1.reranker模型的原理作用。他和embedding模型的区别是什么reranker交叉编码器query和文档拼接作为输入做注意力计算实现查询和文档token级别的比对。embedding独立编码查询和文档的向量。计算余弦相似度。2.向量数据库的选型。milvus、qdrant数据量大支持元数据过滤。3.HNSW索引分层可导航小世界主流的ANN搜索算法。把向量节点分布在多个层级最底层包含所有向量用于精细查找。较高层级边跨度大。检索时贪心地跳向距离目标最近地邻居节点知道在该层找不到更近地节点为止。直至最底层。可以减少距离计算次数。

更多文章