RAG(Retrieval‑Augmented Generation,检索增强生成)是 2020 年由 Facebook AI Research 提出的 AI 架构,核心是将外部知识检索与大语言模型(LLM)生成结合,让模型先从外部知识库获取相关信息再生成回答,以此解决大模型知识滞后、易出幻觉、专业领域知识不足等问题,无需频繁微调即可适配新场景。以下从核心流程、关键价值、主流架构与应用场景展开说明:
一、核心流程(检索→增强→生成)
- 检索(Retrieval):用户输入问题后,系统用语义搜索、向量匹配等技术,从文档、数据库、网页等外部知识库中精准抓取相关信息片段,如从公司财报中提取净利润数据。
- 增强(Augmentation):将检索到的信息与用户问题整合,形成富含上下文的增强提示词,例如把财报数据片段和 “某公司 2024 年净利润是多少” 的问题拼接。
- 生成(Generation):大模型基于增强提示词生成回答,同时可标注信息来源,确保答案有据可依。
二、关键价值
| 价值点 | 说明 |
|---|---|
| 降低幻觉 | 减少模型 “脑补” 错误信息,输出结果可追溯 |
| 知识实时更新 | 无需重训模型,通过更新外部知识库即可获取最新信息 |
| 适配垂直领域 | 快速接入医疗、法律、金融等行业的专业知识库 |
| 降低成本 | 避免大模型微调的高昂费用与漫长周期 |
三、主流架构与工具
- 传统 RAG:基础 “检索→拼接→生成” 流程,适合简单知识问答,代表工具为 LangChain、Haystack。
- 多模态 RAG:支持文本、图像、视频等多类型数据检索与生成,需 OCR、多模态 Embedding 模型配合。
- Agentic RAG:引入智能体,可自主拆解复杂问题、多轮检索优化,适用于订单管理、复杂规划等场景。
- Graph RAG:结合知识图谱建模实体关系,通过图神经网络挖掘深层关联,提升复杂推理能力。
四、典型应用场景
- 智能客服:快速检索产品手册、售后案例,精准解答用户问题。
- 文档问答:解析 PDF、Word 等企业文档,自动回答员工关于政策、流程的咨询。
- 行业知识库:构建医疗诊疗指南、金融合规手册等专业问答系统。
- 实时资讯问答:对接新闻、行情数据,提供最新的财经、体育等领域信息。
五、总结
RAG 的核心是 “先翻书再答题”,通过检索外部知识增强大模型生成能力,是大模型落地的关键技术之一。开发者可从 LangChain 等工具入手,快速搭建基础 RAG 系统,再根据场景需求升级为多模态、Agentic 或 Graph RAG 架构。