Retriever组件

张开发

• 2026/4/10 17:53:20 • 15 分钟阅读

分享文章

一.定义Retriever 根据用户问题从外部知识库中“找出最相关内容”的组件二.在 RAG 里的位置一个标准 RAG 流程是这样的用户问题 ↓ Retriever检索相关文档 ↓ 相关 chunks上下文 ↓ LLM生成回答所以Retriever 找资料LLM 用资料回答三.Retriever 到底做了什么从机制上讲它做三件事1. 把问题转成向量embedding用户输入“LangChain 是什么”会被转成一个向量2. 在向量库里找“最像的内容”比如在 vector store 里找cosine similarity 最近的几个 chunk3. 返回 top-k 结果比如最相关的 3 段文本这些内容会被喂给 LLM四.在 LangChain 里的具体形式在 LangChain 里retriever 是一个统一接口。常见来源1. vectorstore 转换来的Retriever 对 VectorStore 的一层封装查询接口层比如vectorstore.as_retriever() 这是最常见的2. 自定义 retriever你也可以接数据库接搜索 API接知识图谱五. Retriever 可以做的不只是“查相似度”一个好的 retriever不只是 top-k similarity search还可以做1. 过滤filter按 metadata时间、作者等2. rerank重排序先粗查再精排3. query 改写把问题优化后再查4. multi-query一个问题拆成多个问题查所以更准确的定义是Retriever 一套“检索策略”而不是一个简单函数docsretriever.invoke(什么是Transformer)核心问题拆成两个1️⃣ 是否调用大模型LLM2️⃣ 是否进行语义检索六、检索是否调用大模型LLM✅ 默认不会调用以最常见的情况为例retrievervectorstore.as_retriever()docsretriever.invoke(query)实际发生的是query → embedding → 向量相似度搜索 → 返回文档这里没有 LLM 参与❗ 什么时候会调用 LLM只有在特定 Retriever中才会调用1MultiQueryRetrieverMultiQueryRetriever.from_llm(...) 流程query → LLM生成多个query → 检索 → 合并结果2ContextualCompressionRetriever检索后 → LLM压缩内容3SelfQueryRetrieverquery → LLM解析结构化查询 → 检索总结Retriever 类型是否调用 LLMVectorStoreRetriever❌BM25Retriever❌MultiQueryRetriever✅SelfQueryRetriever✅CompressionRetriever✅七、retriever是否进行语义检索✅ 如果是向量检索retrievervectorstore.as_retriever() 是语义检索流程query ↓ embedding向量化 ↓ 向量相似度搜索cosine / dot ↓ 返回 top-k 文档❗ 如果是 BM25BM25Retriever.from_documents(...) ❌ 不是语义检索 ✅ 是关键词检索对比总结Retriever是否语义检索是否用 embeddingVectorStoreRetriever✅✅BM25Retriever❌❌Hybrid Retriever✅ ❌混合

更多文章

前端开发 2026/4/10 17:53:14

免费Windows风扇控制终极指南：轻松实现显卡0转速静音

免费Windows风扇控制终极指南：轻松实现显卡0转速静音【免费下载链接】FanControl.Releases This is the release repository for Fan Control, a highly customizable fan controlling software for Windows. 项目地址: https://gitcode.com/GitHub_Trending/fa/…

张开发

前端开发 2026/4/10 17:49:44

文档管理告别手忙脚乱！Odoo AI文档自动处理，一篇看懂

每天上班，光是整理邮件附件、归类合同发票就要花掉一两个小时？找一份上个月的报价单，翻遍文件夹都找不到？这些问题，Odoo 19的AI文档自动处理功能可以帮你一次性解决。【01 智能分类，文档自动归档】传统方式…

张开发

前端开发 2026/4/10 17:46:12

ArcGIS空间插值实战：5种方法对比与适用场景全解析（附避坑指南）

ArcGIS空间插值实战：5种方法对比与适用场景全解析（附避坑指南） 空间数据插值是GIS分析中的核心技能，但面对ArcGIS工具箱里琳琅满目的插值方法，很多从业者都会陷入选择困难。我曾亲眼见过一位环境工程师因为选错插值方…

张开发

前端开发 2026/4/10 17:46:12

搜索引擎快速收录方法｜SEO 收录底层逻辑，一看就懂

爬虫不是机器人，是“内容猎人”很多人以为搜索引擎收录就是机器冷冰冰地扫一遍网页，其实没那么简单。爬虫更像是一个有偏好的“内容猎人”——它喜欢新鲜、结构清晰、关键词自然分布的内容。如果一篇文章写得像说明书，或者堆满重复词&#xf…

张开发

前端开发 2026/4/10 17:46:12

【系统架构设计师】从理论到实践：构建质量属性效用树与场景化评估指南

1. 质量属性：架构设计的灵魂所在作为系统架构设计师，我们每天都在和各种质量属性打交道。记得去年设计一个电商平台时，产品经理突然提出"双十一要能扛住10倍流量"，那一刻我深刻体会到质量属性不是纸上谈兵的概念。质量…

张开发

前端开发 2026/4/10 17:43:53

ApiPost实战指南：从接口创建到团队协作的全流程解析

1. 从零开始创建你的第一个接口刚接触ApiPost时，我最先被它的简洁界面吸引。作为一款国产的API开发工具，它完美解决了我们团队在接口调试和文档管理上的痛点。下面我就用最直白的方式，带你走完创建接口的全流程。打开ApiPost后，…

张开发

前端开发 2026/4/10 17:37:47

UDOP-large镜像实战：离线环境下CDN禁用Gradio仍可稳定访问Web界面

UDOP-large镜像实战：离线环境下CDN禁用Gradio仍可稳定访问Web界面 1. 引言：当你的网络环境“与世隔绝” 想象一下这个场景：你身处一个严格的内网环境，或者一个网络信号极不稳定的偏远地区。你需要部署一个强大的AI模型来处理手头…

张开发

前端开发 2026/4/10 17:37:17

Labview_DQMH框架实战解析：从TeacherStudent模型看模块化设计

1. DQMH框架入门：为什么需要模块化设计第一次接触LabVIEW的DQMH框架时，我被它优雅的模块化设计深深吸引。想象一下，你正在开发一个教育管理系统，里面有几十位老师和上千名学生。如果所有功能都写在一个巨大的VI里，每次…

张开发

前端开发 2026/4/10 17:36:53

Keil5 MDK-ARM V6编译器下，勾选MicroLIB后报错__initial_sp的两种快速修复法

Keil5 MDK-ARM V6编译器下MicroLIB兼容性问题深度解析与实战修复当你满怀期待地将Keil5项目从ARM Compiler V5升级到V6，却在勾选MicroLIB优化选项后遭遇__initial_sp和__use_two_region_memory的链接错误时，这种从云端跌入谷底的感觉我太熟悉了。作为经…

张开发

前端开发 2026/4/10 17:36:16

2026主流AI音乐生成工具软件推荐：音潮 V3.0 领衔，全民音乐创作进入普惠时代

2026 年，AI 音乐生成技术迈入专业进阶新阶段，AI 写歌软件从 “能生成” 走向 “好听、有情感、可直出”。作为面向大众的AI 一键生成歌曲软件与AI 创作音乐软件，音潮、Suno、Udio 等平台持续迭代升级，为普通用户与创作者提供更低门…

张开发

前端开发 2026/4/10 17:34:33

AI时代新型的项目管理应该是什么样的？概

AI训练存储选型的演进路线第一阶段：单机直连时代早期的深度学习数据集较小，模型训练通常在单台服务器或单张GPU卡上完成。此时直接将数据存储在训练机器的本地NVMe SSD/HDD上。其优势在于IO延迟最低，吞吐量极高，也就是“数据离…

张开发

前端开发 2026/4/10 17:33:45

OMC 爆火：给 Claude Code 装上多智能体编排，效率翻 3-5 倍

点击上方前端Q，关注公众号回复加群，加入前端Q技术交流群GitHub 22k star，32 个专业 Agent 自动协作，成本还能省一半。这个叫 oh-my-claudecode 的项目，可能是目前 Claude Code 生态里最值得装的插件。最近刷 GitHub T…

张开发

Retriever组件

最新文章

调音师专属工具箱：集成常用功能的一站式音频调校辅助软件（火山平台开发，免报毒）

如何用Python实现大麦网自动抢票？5步提升成功率90%的完整指南

Bilibili API评论接口终极调用指南：5个高效数据获取技巧

小米手表表盘设计终极指南：用Mi-Create免费打造个性表盘

Andersen Consulting通过与Kyanon Consulting合作强化数字化转型服务能力

Anthropic Harness工程入门基础教程（非常详细），收藏这一篇就够了！

推荐文章

OpenClaw云端集成Skill流程：2026年部署、配置大模型百炼APIKey、接入钉钉/QQ/飞书/微信

Python flask django高校餐饮档口管理系统的设计与实现

超实用指南：3步打造可移植版waifu2x-caffe

Go语言的JSON处理技巧

2025届毕业生推荐的AI科研平台推荐榜单

前端性能监控吐槽：别再让你的网站慢得像蜗牛！

相关文章

探索Akagi：实时牌局分析与AI决策支持的麻将辅助系统

SEO 视频在不同行业的应用有何差异_SEO 视频的长度应该控制在什么范围内

基于YOLO+DeepSeek的农作物病虫害检测与环境监测一体化智能平台植物病虫害识别系统

生成式引擎优化（GEO）实战指南：从技术架构到行业落地

嵌入式开发调试宏与性能优化实战

LosslessCut：解锁无损视频编辑的5个专业技巧

分享文章

更多文章

免费Windows风扇控制终极指南：轻松实现显卡0转速静音

文档管理告别手忙脚乱！Odoo AI文档自动处理，一篇看懂

ArcGIS空间插值实战：5种方法对比与适用场景全解析（附避坑指南）

搜索引擎快速收录方法｜SEO 收录底层逻辑，一看就懂

【系统架构设计师】从理论到实践：构建质量属性效用树与场景化评估指南

ApiPost实战指南：从接口创建到团队协作的全流程解析

UDOP-large镜像实战：离线环境下CDN禁用Gradio仍可稳定访问Web界面

Labview_DQMH框架实战解析：从TeacherStudent模型看模块化设计

Keil5 MDK-ARM V6编译器下，勾选MicroLIB后报错__initial_sp的两种快速修复法

2026主流AI音乐生成工具软件推荐：音潮 V3.0 领衔，全民音乐创作进入普惠时代

AI时代新型的项目管理应该是什么样的？概

OMC 爆火：给 Claude Code 装上多智能体编排，效率翻 3-5 倍

Retriever组件

最新文章

调音师专属工具箱：集成常用功能的一站式音频调校辅助软件（火山平台开发，免报毒）

如何用Python实现大麦网自动抢票？5步提升成功率90%的完整指南

Bilibili API评论接口终极调用指南：5个高效数据获取技巧

小米手表表盘设计终极指南：用Mi-Create免费打造个性表盘

Andersen Consulting通过与Kyanon Consulting合作强化数字化转型服务能力

Anthropic Harness工程入门基础教程（非常详细），收藏这一篇就够了！

推荐文章

OpenClaw云端集成Skill流程：2026年部署、配置大模型百炼APIKey、接入钉钉/QQ/飞书/微信

Python flask django高校餐饮档口管理系统的设计与实现

超实用指南：3步打造可移植版waifu2x-caffe

Go语言的JSON处理技巧

2025届毕业生推荐的AI科研平台推荐榜单

前端性能监控吐槽：别再让你的网站慢得像蜗牛！

相关文章

探索Akagi：实时牌局分析与AI决策支持的麻将辅助系统

SEO 视频在不同行业的应用有何差异_SEO 视频的长度应该控制在什么范围内

基于YOLO+DeepSeek的农作物病虫害检测与环境监测一体化智能平台 植物病虫害识别系统

生成式引擎优化（GEO）实战指南：从技术架构到行业落地

嵌入式开发调试宏与性能优化实战

LosslessCut：解锁无损视频编辑的5个专业技巧

分享文章

更多文章

基于YOLO+DeepSeek的农作物病虫害检测与环境监测一体化智能平台植物病虫害识别系统