彰化县网站建设_网站建设公司_交互流畅度_seo优化
2025/12/31 17:06:27 网站建设 项目流程

在上文[检索增强生成(RAG)范式演进]中,我们总结了RAG的5种演进模式,以针对不同场景下的用户查询,提供检索增强生成方案。

本文将阐述智能体检索增强生成(Agentic RAG)的7类架构模式,以及实现架构模式的框架工具。

  • 单代理智能RAG(Single-Agent Agentic RAG)
  • 多代理智能RAG(Multi-Agent Agentic RAG)
  • 层次化智能RAG(HierarchicalAgenticRAG)
  • 自我纠正智能RAG(Agentic Corrective RAG)
  • 自适应智能RAG(Adaptive Agentic RAG)
  • 基于图的智能RAG(Graph-Based Agentic RAG)
  • 智能文档工作流(Agentic Document Workflows)

01 单代理智能RAG(Single-Agent Agentic):路由器

单代理智能RAG作为集中式决策系统,由单一代理负责信息检索、路由与整合(如图16所示)。该架构通过将这些任务整合至单一统一代理,显著简化系统,尤其适用于工具或数据源有限的场景。

图1:单代理RAG概述

工作流:

1)查询提交与评估:该流程始于用户提交查询时。协调代理(或主检索代理)接收查询并进行分析,以确定最适宜的信息来源。

2)知识源路由检索:根据查询类型,协调Agent从多种检索选项中进行选择:

  • 结构化数据库:对于需要访问表格数据的查询,系统可采用Text to SQL引擎,该引擎可与PostgreSQL或MySQL等数据库进行交互。
  • 语义搜索:在处理非结构化信息时,通过基于向量的检索技术获取相关文档(如PDF文件、书籍、组织记录)。
  • 网络检索:为获取实时或广泛背景信息,系统采用网络检索工具以调取最新在线数据。
  • 推荐系统:针对个性化或情境化查询,该系统调用推荐引擎以提供定制化建议。

3)数据整合与大语言模型生成:从选定数据源获取相关数据后,将其输入大语言模型(LLM)。该模型将整合多源信息,通过上下文关联性生成连贯的响应。

4)输出生成:最终,系统会生成一个全面且面向用户的答案,以解决原始查询。该响应以可操作、简洁的格式呈现,并可选择性地包含对所用来源的引用或注释。

主要特点:

  • 集中化简化:单一代理处理所有检索与路由任务,使得该架构的设计、实现和维护均更为简便。
  • 效率与资源优化:通过减少代理数量并简化协调流程,该系统可降低计算资源需求,从而更快处理查询请求。
  • 动态路由:智能体实时评估每个查询,选择最合适的知识源(如结构化数据库、语义搜索、网络搜索)。
  • 工具通用性:支持多种数据源和外部API,可实现结构化与非结构化工作流程。

适用场景:

该模式适用于任务明确或集成需求有限的应用场景(如文档检索、基于SQL的工作流)。

02 多代理智能RAG(Multi-Agent Agentic RAG)

多智能体RAG是单智能体架构的模块化扩展方案,通过整合多个专业智能体,能够高效处理复杂工作流程和多样化查询需求。该系统摒弃了传统单智能体承担推理、检索和响应生成等全部任务的模式,而是将职责分配给多个智能体,每个智能体都针对特定角色或数据源进行优化。

图2:多代理智能RAG概述

工作流:

  1. 查询提交:流程始于用户提交的查询,该查询由协调代理或主检索代理接收。该代理作为中央协调者,根据查询需求将查询任务分配给专业检索代理。
  2. 专业检索Agent:查询任务被分配给多个检索智能体,每个Agent专注于特定类型的数据源或任务。例如:
  • Agent 1:负责处理结构化查询,例如与PostgreSQL或MySQL等SQL数据库进行交互。
  • Agent 2:负责语义检索,用于从PDF文档、书籍或内部记录等来源提取非结构化数据。
  • Agent 3:专注于从网络搜索或API中实时获取公共信息。
  • Agent 4:专精于推荐系统,能根据用户行为或个人资料提供情境感知的智能推荐。
  1. 具访问与数据检索:每个专业检索Agent将其查询路由至其领域内的适当工具或数据源(如下)。

  2. 检索过程以并行方式执行,可高效处理多种查询类型。

  • 向量搜索:用于语义相关性分析。
  • 文本转SQL:适用于结构化数据.
  • 网络搜索:获取实时公共信息。
  • API:用于访问外部服务或专有系统。
  1. 数据整合与大语言模型合成:检索完成后,所有智能体的数据将被传输至大语言模型(LLM)。该模型会将检索到的信息整合为连贯且符合上下文的响应,实现多源信息的无缝融合。

  2. 输出生成:系统生成综合响应,并以可操作且简洁的格式反馈给用户。

主要特点:

  • 模块化设计:各智能体独立运行,可根据系统需求灵活增减。
  • 并行处理:通过多个代理的并行处理,系统能够高效处理高查询量。
  • 任务专业化:每个智能体均针对特定类型的查询或数据源进行优化,从而提升检索准确性和相关性。
  • 效率:通过将任务分配给专业代理,该系统可有效减少瓶颈并提升复杂工作流程的性能。

适用场景:适用于涵盖研究、分析、决策制定及客户支持等多个领域的应用场景。

主要挑战:

  • 协调复杂性:管理Agent间通信与任务委派需要精密的协调机制。
  • 计算开销:多个智能体的并行处理可能增加资源消耗。
  • 数据整合:将来自不同来源的输出综合为连贯的响应并非易事,这需要高级大语言模型(LLM)的能力。

典型用例:

03 层次化智能RAG系统(Hierarchical Agentic RAG)

分层智能检索系统(RAG)采用分层代理架构,高层代理负责监督和指导底层代理。这种结构支持多层级决策,确保查询由最合适的资源处理。

图3:层次化智能RAG概述

工作流

  1. 查询受理:用户提交查询后,由负责初步评估与任务分配的一线客服专员接收。
  2. 战略决策:顶级代理评估查询的复杂性,并决定优先处理哪些子代理或数据源。根据查询领域,某些数据库、API或检索工具可能被认为更可靠或相关。
  3. 下属代理的委派:顶级代理将任务分配给专精于特定检索方法(如SQL数据库、网络搜索或专有系统)的下级代理。这些代理独立执行其分配的任务。
  4. 聚合与综合:由下级代理收集并整合信息,由上级代理进行综合,形成连贯的响应。
  5. 回应传递:最终合成的答案将返回给用户,确保该回应既全面又与上下文相关。

主要特点和优势:

  • 策略性优先级排序:顶级智能体可根据查询复杂度、可靠性或上下文环境,对数据源或任务进行优先级排序。
  • 可扩展性:通过将任务分配至多个智能体层级,可有效处理高度复杂或多维度的查询。
  • 提升决策能力:高级智能体通过战略监督机制,显著提升响应的总体准确性和连贯性。

挑战:

  • 协调复杂性:在多层级间保持健壮的代理间通信会增加编排开销。

  • 资源分配:在层级间高效分配任务以避免瓶颈并非易事。

04 纠正式智能RAG(Agentic Corrective RAG)

纠正式智能RAG:通过引入自我校正检索结果的机制,如图19所示,可提升文档利用率并优化响应生成质量。该技术通过将智能代理嵌入工作流程,确保上下文文档与响应的迭代优化,从而最大限度减少错误并提高相关性。

图4:纠正式智能RAG概述

纠正式RAG的核心理念:该系统的核心原则在于能够动态评估检索到的文档、执行纠正措施,并优化查询以提升生成响应的质量。其调整方法如下:

  • 文档相关性评估:相关性评估代理对检索到的文档进行相关性评估。低于相关性阈值的文档将触发纠正步骤。
  • 查询优化与增强:查询通过查询优化代理进行优化,该代理利用语义理解来提升检索效果,从而获得更优结果。
  • 从外部来源动态检索:当上下文信息不足时,外部知识检索代理会执行网络搜索或访问替代数据源以补充检索到的文档。
  • 应答合成:所有经过验证和优化的信息均传递至应答合成代理,以生成最终应答。

工作流程:

  1. 上下文检索代理:负责从向量数据库中检索初始上下文文档。
  2. 相关性评估代理:对检索到的文档进行相关性评估,并标记任何不相关或模糊的文档以采取纠正措施。
  3. 查询优化代理:通过重写查询语句以提升其特异性和相关性,利用语义理解能力优化结果。
  4. 外部知识检索代理:当上下文文档不足时,执行网络搜索或访问替代数据源。
  5. 应答合成代理:将所有验证信息整合为连贯且准确的应答。

核心功能与优势:

  • 迭代校正:通过动态识别并修正无关或模糊的检索结果,确保高响应准确性。
  • 动态适应性:整合实时网络搜索与查询优化功能,以提升检索精度。
  • 代理模块化:每个代理执行特定任务,确保高效且可扩展的运行。
  • 真实性保证:通过验证所有检索和生成的内容,纠正性RAG(纠正性检索与生成)可最大限度降低幻觉或错误信息的风险。

用例:学术研究助理

05 自适应智能RAG(Adaptive Agentic RAG)

自适应检索增强生成(Adaptive RAG)通过动态调整查询处理策略来提升大型语言模型(LLMs)的灵活性和效率,其策略会根据输入查询的复杂程度进行调整。与静态检索流程不同,Adaptive RAG 采用分类器评估查询复杂度,从而确定最合适的处理方式——从单步检索到多步推理,甚至如图20所示,对简单查询直接跳过检索环节。

图5:自适应智能RAG概述

自适应RAG的核心理念在于其能够根据查询的复杂性动态调整检索策略。自适应RAG的调整方法如下:

  • 直接查询:对于无需额外检索的事实性问题(例如“水的沸点是多少?”),系统会直接利用现有知识生成答案。
  • 简单查询:对于需要最少上下文信息的中等复杂度任务(例如“我的最新电费账单状态如何?”),系统通过单步检索获取相关详细信息。
  • 复杂查询:针对需要迭代推理的多层查询(例如:“过去十年间X市人口变化趋势如何?影响因素有哪些?”),系统采用多步骤检索机制,通过逐步优化中间结果,最终得出全面结论。

工作流程:

1.分类器角色:

  • 一个较小的语言模型分析查询以预测其复杂性。
  • 该分类器通过自动标注数据集进行训练,这些数据集源自模型过往输出结果及查询模式。

2.动态策略选择:

  • 对于简单查询,系统可避免不必要的检索,直接利用大语言模型(LLM)生成响应。
  • 对于简单查询,该系统采用单步检索流程以获取相关上下文。
  • 对于复杂查询,系统会激活多步骤检索机制,以确保迭代优化和增强推理能力。

3.LLM集成:

  • LLM将检索到的信息整合为连贯的响应。
  • 大语言模型(LLM)与分类器之间的迭代交互可实现复杂查询的优化。

核心功能与优势:

  • 动态适应性:根据查询复杂度动态调整检索策略,同时优化计算效率与响应准确性。
  • 资源效率:在确保复杂查询得到充分处理的同时,最大限度减少简单查询的冗余开销。
  • 准确性提升:迭代优化确保复杂查询以高精度得到解决。
  • 灵活性:可扩展以整合其他途径,例如领域特定工具或外部API。

用例:客户支持助手

06 基于图的智能RAG(Graph-Based Agentic RAG)

Agentic Framework for GraphRAG

Agent-G :提出了一种创新的智能体架构,将图知识库与非结构化文档检索相结合。该框架通过整合结构化与非结构化数据源,显著提升了检索增强生成(RAG)系统的推理与检索精度。如图21所示,其采用模块化检索器库、动态智能体交互及反馈循环机制,确保输出结果的高质量。

图6:Agent-G概述:GraphRAG智能体框架

Agent-G的核心理念在于其能够动态地将检索任务分配给专门的智能体,同时利用图知识库和文本文档。Agent-G的检索策略调整如下:

  • 图知识库:利用结构化数据提取关系、层级结构及关联(例如医疗保健中的疾病-症状映射)。
  • 非结构化文档:传统文本检索系统通过提供上下文信息来补充图数据。
  • 评估模块:对检索到的信息的相关性和质量进行评估,确保其与查询内容一致。
  • 反馈循环:通过迭代验证与重新查询优化检索与合成过程。

工作流程:

1.取款银行(Retriever****Bank):

• 一套模块化智能体专门用于检索基于图结构或非结构化数据。

• 智能体根据查询需求动态选择相关数据源。

2.评论模块:

• 验证所获取数据的相关性与质量。

• 为重新检索或优化结果标记低置信度。

3.动态智能体交互:

• 任务专用代理协同整合多种数据类型。

• 确保跨图谱与文本源的检索与整合一致性。

  1. LLM集成:

• 将经过验证的数据整合为连贯的回应。

• 评论者的迭代反馈确保与查询意图保持一致。

核心功能与优势:

  • 强化推理:将图结构中的结构化关系与非结构化文档中的上下文信息相结合。
  • 动态适应性:根据查询需求动态调整检索策略。
  • 准确性提升:Critic模块可降低响应中出现无关或低质量数据的风险。
  • 可扩展模块化:支持新增执行特定任务的智能体,从而提升系统可扩展性。

用例:医疗诊断

GeAR:Graph-Enhanced Agent for Retrieval-Augmented Generation

GeAR :该研究提出了一种基于图检索机制的智能体框架,通过整合图扩展技术与智能体架构,显著提升了传统检索增强生成(RAG)系统的性能。如图22所示,该框架有效解决了多跳检索场景中的挑战,显著增强了系统处理复杂查询的能力。

图7:GeAR概述:图增强智能体检索增强生成

GeAR的核心理念是通过两项主要创新提升RAG性能:

  • 图结构扩展:通过将检索过程扩展至图结构化数据,增强传统基础检索器(如BM25)的功能,使系统能够捕捉实体间的复杂关系与依赖关系。
  • 代理框架:采用基于代理的架构,通过图扩展技术更高效地管理检索任务,使检索过程能够实现动态自主决策。

工作流程:

  1. 图形扩展模块:
  • 将基于图的数据整合至检索流程中,使系统在检索过程中能够考虑实体间的关系。
  • 通过扩展搜索空间以包含关联实体,增强基础检索器处理多跳查询的能力。
  1. 基于Agent的检索:
  • 采用智能体框架管理检索过程,可根据查询复杂度动态选择并组合检索策略。
  • 代理可自主决定采用图扩展检索路径以提高检索信息的相关性和准确性。
  1. LLM集成:

• 将通过图扩展技术获取并增强的信息,与大型语言模型(LLM)的能力相结合,以生成连贯且上下文相关的响应。

• 该集成确保生成过程同时参考非结构化文档和结构化图数据。

核心功能与优势

  • 强化多跳检索:GeAR的图扩展功能使系统能够处理需要对多个相互关联的信息片段进行推理的复杂查询。
  • 代理决策机制:该代理框架支持检索策略的动态自主选择,从而提升效率与相关性。
  • 准确性提升:通过整合结构化图谱数据,GeAR提高了检索信息的精确度,从而生成更准确且符合上下文的响应。
  • 可扩展性:该智能体框架的模块化特性可根据需求集成额外的检索策略和数据源。

用例:多跳问答

07 智能文档工作流(Agentic Document Workflows)

智能文档工作流(ADW)通过实现端到端知识工作自动化,拓展了传统的检索增强生成(RAG)范式。这些工作流协调复杂的文档处理流程,将文档解析、检索、推理及结构化输出与智能代理相结合(见图23)。 ADW 系统通过维护状态、协调多步骤工作流以及应用领域特定逻辑来处理文档,从而克服了智能文档处理(IDP)和RAG的局限性。

图8:代理文档工作流概述(ADW)

工作流:

  1. 文档解析与信息结构化:
  • 通过企业级工具(如LlamaParse)解析文档,提取相关数据字段,包括发票编号、日期、供应商信息、明细项目及付款条款。

  • 结构化数据经过组织化处理,以便后续处理。

  1. 全流程状态维护:
  • 该系统维护文档上下文状态,确保多步骤工作流中的内容一致性与相关性。
  • 跟踪文档在不同处理阶段的进展。
  1. 知识检索:
  • 相关参考文献从外部知识库(如LlamaCloud)或向量索引中检索获取。

  • 检索实时、领域特定的指南以优化决策制定。

  1. 智能体协调:
  • 智能代理应用业务规则,执行多跳推理,并生成可操作的推荐。
  • 集成解析器、检索器及外部API等组件,实现无缝对接。
  1. 可操作输出生成:
  • 输出以结构化格式呈现,针对特定用例进行定制。

  • 将建议与提取的见解整合为简明且可操作的报告。

核心功能与优势

  • 状态维护:追踪文档上下文与工作流阶段,确保流程一致性。
  • 多步骤编排:可处理涉及多个组件及外部工具的复杂工作流。
  • 领域特定智能:应用定制化业务规则与指南,提供精准推荐。
  • 可扩展性:支持通过模块化和动态代理集成实现大规模文档处理。
  • 生产力提升:自动化重复性任务,同时增强人类在决策中的专业能力。

如何学习大模型 AI ?

由于新岗位的生产效率,要优于被取代岗位的生产效率,所以实际上整个社会的生产效率是提升的。

但是具体到个人,只能说是:

“最先掌握AI的人,将会比较晚掌握AI的人有竞争优势”。

这句话,放在计算机、互联网、移动互联网的开局时期,都是一样的道理。

我在一线科技企业深耕十二载,见证过太多因技术卡位而跃迁的案例。那些率先拥抱 AI 的同事,早已在效率与薪资上形成代际优势,我意识到有很多经验和知识值得分享给大家,也可以通过我们的能力和经验解答大家在大模型的学习中的很多困惑。我们整理出这套AI 大模型突围资料包

  • ✅ 从零到一的 AI 学习路径图
  • ✅ 大模型调优实战手册(附医疗/金融等大厂真实案例)
  • ✅ 百度/阿里专家闭门录播课
  • ✅ 大模型当下最新行业报告
  • ✅ 真实大厂面试真题
  • ✅ 2025 最新岗位需求图谱

所有资料 ⚡️ ,朋友们如果有需要《AI大模型入门+进阶学习资源包》下方扫码获取~

① 全套AI大模型应用开发视频教程

(包含提示工程、RAG、LangChain、Agent、模型微调与部署、DeepSeek等技术点)

② 大模型系统化学习路线

作为学习AI大模型技术的新手,方向至关重要。 正确的学习路线可以为你节省时间,少走弯路;方向不对,努力白费。这里我给大家准备了一份最科学最系统的学习成长路线图和学习规划,带你从零基础入门到精通!

③ 大模型学习书籍&文档

学习AI大模型离不开书籍文档,我精选了一系列大模型技术的书籍和学习文档(电子版),它们由领域内的顶尖专家撰写,内容全面、深入、详尽,为你学习大模型提供坚实的理论基础。

④ AI大模型最新行业报告

2025最新行业报告,针对不同行业的现状、趋势、问题、机会等进行系统地调研和评估,以了解哪些行业更适合引入大模型的技术和应用,以及在哪些方面可以发挥大模型的优势。

⑤ 大模型项目实战&配套源码

学以致用,在项目实战中检验和巩固你所学到的知识,同时为你找工作就业和职业发展打下坚实的基础。

⑥ 大模型大厂面试真题

面试不仅是技术的较量,更需要充分的准备。在你已经掌握了大模型技术之后,就需要开始准备面试,我精心整理了一份大模型面试题库,涵盖当前面试中可能遇到的各种技术问题,让你在面试中游刃有余

以上资料如何领取?

为什么大家都在学大模型?

最近科技巨头英特尔宣布裁员2万人,传统岗位不断缩减,但AI相关技术岗疯狂扩招,有3-5年经验,大厂薪资就能给到50K*20薪!

不出1年,“有AI项目经验”将成为投递简历的门槛。

风口之下,与其像“温水煮青蛙”一样坐等被行业淘汰,不如先人一步,掌握AI大模型原理+应用技术+项目实操经验,“顺风”翻盘!

这些资料真的有用吗?

这份资料由我和鲁为民博士(北京清华大学学士和美国加州理工学院博士)共同整理,现任上海殷泊信息科技CEO,其创立的MoPaaS云平台获Forrester全球’强劲表现者’认证,服务航天科工、国家电网等1000+企业,以第一作者在IEEE Transactions发表论文50+篇,获NASA JPL火星探测系统强化学习专利等35项中美专利。本套AI大模型课程由清华大学-加州理工双料博士、吴文俊人工智能奖得主鲁为民教授领衔研发。

资料内容涵盖了从入门到进阶的各类视频教程和实战项目,无论你是小白还是有些技术基础的技术人员,这份资料都绝对能帮助你提升薪资待遇,转行大模型岗位。

以上全套大模型资料如何领取?

需要专业的网站建设服务?

联系我们获取免费的网站建设咨询和方案报价,让我们帮助您实现业务目标

立即咨询