共享记忆(Memory Sharing, MS)框架是为解决 LLM 智能体在开放式任务(如诗歌创作、计划生成)中示例不足、理解有限的问题而设计的,通过 “多智能体共享记忆池 + 实时记忆检索 / 更新”,强化上下文学习能力,让智能体在无大量预训练示例的情况下,也能生成符合预期的结果。
MS 框架核心定位与解决的痛点
- 核心定位:为 LLM 多智能体构建 “集体知识库”,将单个智能体的 “提示 - 回答(PA)对” 转化为所有智能体可复用的记忆,提升整体在开放式任务中的表现。
- 核心概念:MS 框架将每个智能体生成的(提示,回答)对(PA Pair)定义为 “一条经验记忆”,并将其视为核心 “知识资产” 存入全局共享记忆池。
MS 是一个旨在通过共享记忆来增强多个基于 LLM 的智能体性能的框架,同时保留其原始创造力
- 解决的核心痛点:
- 传统智能体依赖 “单次提示内的示例”,开放式任务(如诗歌创作)因示例不全面,生成结果质量不稳定;
- 单智能体记忆无法复用,不同智能体处理同类任务时需重复学习,效率低;
- 对复杂逻辑任务(如横向思维谜题),单智能体难以理解多样化解题思路,易陷入固定模式。
MS 与传统 RAG 和 AutoGen 的区别
维度 | 传统 RAG | AUTOGEN(多智能体) | MS 框架 |
记忆来源 | 静态知识库(文档) | 临时对话历史 | 动态生成的 PA 对(可持久化) |
记忆共享 | 无(单次查询独立) | 局部(会话内) | 全局(跨智能体、跨任务) |
记忆进化 | 否 | 否 | 是(检索器在线更新) |
创造力保留 | 弱(受文档限制) | 中 | 强(鼓励新记忆生成) |
MS 框架三大核心组件
记忆生成(Memory Generation)
- 核心定义:智能体接收查询后,检索器从记忆池提取相关记忆,与原始查询结合形成 “增强提示”,智能体基于此生成回答,最终形成 “新记忆候选(PA 对)”。
- 关键动作:
- 检索策略:按预设规则确定提取记忆数量(如 “三拍学习” 策略,提取 3 条最相关记忆);
- 提示构建:将 “原始查询 + 检索到的记忆(历史 PA 对)” 拼接,例如:原始查询:“写一首关于春天的十四行诗”检索记忆:[“提示:写春天的诗,需包含‘嫩芽’‘微风’;回答:《春日初醒》...”, “提示:十四行诗需 14 行,押韵格式 ABAB;回答:《春韵》...”]增强提示:“参考以下创作经验,写一首关于春天的十四行诗:1. 提示:写春天的诗... 2. 提示:十四行诗需...”
- 作用:为智能体提供 “同类任务的历史经验”,弥补单次提示示例不足的问题。
记忆写入(Memory Writing)
- 核心定义:新生成的记忆候选(PA 对)需经过评分机制评估,达标后才能加入共享记忆池,确保记忆质量。
- 关键动作:
- 评分标准:由 LLM 自动生成领域适配的标准(如文学创作需 “符合体裁格式、语言流畅”,计划生成需 “逻辑清晰、覆盖核心需求”),再经人工审核校准一致性;
- 筛选逻辑:评分高于阈值(如 80 分)的 PA 对加入记忆池,低于阈值则丢弃,避免低质量记忆干扰后续检索;
- 作用:保证记忆池内的记忆 “有用、可用”,避免冗余或错误信息降低检索效率。
记忆检索(Memory Retrieval)
- 核心定义:检索器会用新加入记忆池的 PA 对持续更新自身(如优化相似性匹配模型),确保后续能更精准地找到与新查询相关的记忆。
- 关键动作:
- 检索依据:基于 “查询与记忆中‘提示’的语义相似度”(如用 Sentence-BERT 计算向量相似度)筛选记忆;
- 动态适配:随着记忆池扩容,检索器会调整匹配策略(如增加 “体裁”“任务类型” 等元数据过滤),提升检索精准度;
- 作用:让检索器 “越用越准”,确保智能体每次都能拿到最相关的历史经验。
MS 框架工作流程
以 “Sonnet 智能体创作十四行诗” 为例:
- 检索记忆Sonnet 智能体接收到查询 “写一首关于秋日的十四行诗”,检索器从共享记忆池(含其他诗歌创作智能体的 PA 对)中,提取 3 条与 “十四行诗创作”“秋日主题” 相关的记忆。
- 生成回答检索到的记忆与原始查询拼接成 “增强提示”,Sonnet 基于此生成十四行诗,形成新的记忆候选(PA 对:“提示:写秋日十四行诗;回答:《秋颂》... ”)。
- 评分筛选评分器按 “十四行诗格式(14 行、ABAB 押韵)”“秋日主题契合度”“语言流畅性” 给新候选打分,若得 90 分(高于 80 分阈值),则通过筛选。
- 更新记忆与检索器达标后的 PA 对加入共享记忆池;同时,检索器用这条新记忆更新自身的相似性模型,后续其他智能体查询 “秋日诗歌创作” 时,能更快定位到这条记忆。
- 所有智能体(如 Sonnet、Limericks 创作智能体)共享同一记忆池,可跨智能体复用记忆 —— 比如 Limericks 智能体后续处理 “秋日打油诗” 查询时,也能检索到 Sonnet 的 “秋日主题” 记忆。
MS 框架实验验证
文学创作领域(十四行诗、打油诗等)
- 任务:让 3 个智能体分别生成不同体裁的文学作品,共享同一 “文学记忆池”。
- 结果:使用其他智能体的记忆后,智能体生成的作品 “体裁符合度” 提升 35%,“语言流畅性” 提升 28%(如十四行诗格式错误率从 25% 降至 8%)。
- 结论:跨智能体记忆共享能补充单一智能体的体裁知识,提升创作规范性。
非传统逻辑问题解决领域(横向思维谜题、谜语)
- 任务:让智能体解决 “‘什么东西越洗越脏?’(答案:水)” 这类依赖发散思维的谜题,共享 “逻辑谜题记忆池”。
- 结果:尽管 ROUGE 分数(词级重叠度)提升不明显,但 BERTScore(语义相似度)提升 42%,说明智能体能从记忆中吸收多样化解题思路,生成的答案更贴合语义逻辑(而非机械模仿)。
- 结论:记忆共享能帮助智能体突破固定思维,理解复杂逻辑。
计划生成领域(学习计划、旅行计划等)
- 任务:让智能体为用户生成 “7 天考研复习计划”“5 天云南旅行计划”,共享 “计划生成记忆池”。
- 结果:随着记忆池内 PA 对从 100 条增至 500 条,智能体生成计划的 “核心需求覆盖率” 从 65% 提升至 92%(如旅行计划从 “仅列景点” 升级为 “含交通、住宿、时间分配”)。
- 结论:记忆池扩容能让智能体逐步覆盖更多用户需求,生成更全面的计划。
MS 框架的核心价值
- 打破智能体 “记忆孤岛”:多智能体共享同一记忆池,避免重复学习,提升整体效率;
- 降低开放式任务门槛:无需为每个任务准备大量预训练示例,通过复用记忆即可提升生成质量;
- 动态迭代能力:记忆池与检索器持续更新,系统 “越用越强”,适配更多样化的查询需求。