本文提出Agent-as-a-Graph方法,将智能体和工具作为平等节点构建二分图知识图谱,解决多智能体系统中精准检索痛点。通过向量初筛、类型加权RRF融合和图遍历聚合三步流程,Recall@5提升18.6%,且不依赖特定Embedding模型,具有跨模型泛化能力强、可手动调优等优势,显著提升检索效率和准确性。
当前大语言模型多智能体系统面临的一个核心痛点:如何在成千上万个工具和智能体中,精准找到最适合当前任务的那一个?
- Agent-Only检索(智能体导向)智能体描述往往无法覆盖其工具库的全部能力。
- Tool-Only检索(工具导向)把每个工具当作独立个体。这忽略了工具间的协同效应
Figure 1: 传统方法与Agent-as-Graph对比
传统方法要么只能看到"智能体层面",要么只能看到"工具层面",无法在统一空间中进行权衡。
💡 二、把智能体和工具都变成图谱节点
核心思想:Agent-as-a-Graph
研究团队的天才之处在于:不再把智能体和工具看作两个独立层级,而是将它们作为平等节点放入知识图谱!
整个系统被建模为一个**二分图 G = (Agents, Tools, Edges)**:
- 智能体节点(𝒜):包含智能体名称和描述
- 工具节点(𝒯):包含工具名称和描述
- 所有权边(E):明确连接每个工具到其父智能体
这种方法一举三得:
- 细粒度匹配:工具节点保留了具体功能描述
- 上下文保留:通过图遍历总能回到父智能体
- 统一检索:在同一个向量空间中对齐两种节点
三步检索流程(Algorithm 1)
Algorithm 1: Agent-as-a-Graph检索算法
第一步:向量初筛对查询q,从工具库𝒞ₜ和智能体库𝒞ₐ中分别检索Top-N候选(N ≫ K),得到两个初始列表。
第二步:类型加权RRF融合这是论文的神来之笔!传统RRF对所有结果一视同仁,但论文提出按节点类型加权的RRF(wRRF):
α(工具节点)α(智能体节点)
其中α_𝒜和α_𝒯是两个可解释旋钮,允许你手动调优智能体覆盖度与工具精度的平衡!这种方式既保留了RRF的鲁棒性,又引入了对异构节点的灵活控制。
第三步:图遍历聚合从融合后的列表中逐个取出节点,如果是工具则通过owner(e)函数找到其父智能体,最终聚合出Top-K个可执行智能体。
📊 三、效果显著且架构通用
基准测试结果(Table 1)
Table 1: LiveMCPBench基准对比
使用OpenAI text-embedding-ada-002模型的结果显示:
- Recall@5达到0.83,比之前的SOTA(MCPZero)提升18.6%
- nDCG@5达到0.46,显著高于其他基线
- 超过39%的检索结果来自智能体节点,34%通过工具边追溯获得,证明两类节点都不可或缺
跨模型泛化能力(Table 2)
Table 2: 不同嵌入模型的性能对比
最令人振奋的是,这个方案不挑Embedding模型!在8种完全不同的嵌入架构上测试(从谷歌Vertex AI、亚马逊Titan到OpenAI和开源的All-MiniLM-L6-v2):
- 平均Recall@5:0.85 vs 0.70(提升19.4%)
- 标准差仅0.02,性能波动极小
- 甚至在小模型All-MiniLM-L6-v2上也提升了19.4%
这说明改进来自图谱结构本身,而非特定向量表示,对生产部署极其友好!
类型权重调优(Figure 2 & Table 3)
Table 3: 加权RRF配置对比
Figure 2: 不同类型权重配置的性能曲线
通过网格搜索发现:
- 最优比例:α_𝒜:α_𝒯 = 1.5:1(智能体权重稍高)
- 极端偏向会损害性能(3:1智能体偏重导致Recall降至0.76)
- 相比标准加权RRF,类型特定权重设计额外提升2.41%
这种可解释、可手动调优的特性,让运维人员能根据领域特点灵活调整,无需重新训练模型。
如何学习AI大模型?
如果你对AI大模型入门感兴趣,那么你需要的话可以点击这里大模型重磅福利:入门进阶全套104G学习资源包免费分享!
这份完整版的大模型 AI 学习和面试资料已经上传CSDN,朋友们如果需要可以微信扫描下方CSDN官方认证二维码免费领取【保证100%免费】
这是一份大模型从零基础到进阶的学习路线大纲全览,小伙伴们记得点个收藏!
第一阶段:从大模型系统设计入手,讲解大模型的主要方法;
第二阶段:在通过大模型提示词工程从Prompts角度入手更好发挥模型的作用;
第三阶段:大模型平台应用开发借助阿里云PAI平台构建电商领域虚拟试衣系统;
第四阶段:大模型知识库应用开发以LangChain框架为例,构建物流行业咨询智能问答系统;
第五阶段:大模型微调开发借助以大健康、新零售、新媒体领域构建适合当前领域大模型;
第六阶段:以SD多模态大模型为主,搭建了文生图小程序案例;
第七阶段:以大模型平台应用与开发为主,通过星火大模型,文心大模型等成熟大模型构建大模型行业应用。
100套AI大模型商业化落地方案
大模型全套视频教程
200本大模型PDF书籍
👉学会后的收获:👈
• 基于大模型全栈工程实现(前端、后端、产品经理、设计、数据分析等),通过这门课可获得不同能力;
• 能够利用大模型解决相关实际项目需求: 大数据时代,越来越多的企业和机构需要处理海量数据,利用大模型技术可以更好地处理这些数据,提高数据分析和决策的准确性。因此,掌握大模型应用开发技能,可以让程序员更好地应对实际项目需求;
• 基于大模型和企业数据AI应用开发,实现大模型理论、掌握GPU算力、硬件、LangChain开发框架和项目实战技能, 学会Fine-tuning垂直训练大模型(数据准备、数据蒸馏、大模型部署)一站式掌握;
• 能够完成时下热门大模型垂直领域模型训练能力,提高程序员的编码能力: 大模型应用开发需要掌握机器学习算法、深度学习框架等技术,这些技术的掌握可以提高程序员的编码能力和分析能力,让程序员更加熟练地编写高质量的代码。
LLM面试题合集
大模型产品经理资源合集
大模型项目实战合集
👉获取方式:
😝有需要的小伙伴,可以保存图片到wx扫描二v码免费领取【保证100%免费】🆓