Clawdbot 是如何实现永久记忆的？

张开发

• 2026/4/5 8:06:29 • 15 分钟阅读

分享文章

下文是如何构建的在深入探讨记忆之前我们先来理解模型在每次请求时能看到什么[0] 系统提示词静态指令条件指令 [1] 项目上下文引导文件AGENTS.md、SOUL.md 等 [2] 对话历史消息、工具调用、压缩摘要 [3] 当前消息系统提示词定义了Agent的能力和可用工具。与记忆相关的是项目上下文它包含了用户可编辑的Markdown文件这些文件会被注入到每次请求中这些文件位于Agent的工作空间中与记忆文件并存使得整个Agent的配置变得透明且可编辑。上下文 vs 记忆理解上下文和记忆之间的区别是理解Clawdbot的基础。上下文是模型在单次请求中能看到的一切上下文系统提示词对话历史工具结果附件上下文的特性临时的——只存在于本次请求期间有限的——受限于模型的上下文窗口例如20万token昂贵的——每个token都计入API成本和速度记忆是存储在磁盘上的内容记忆 MEMORY.md memory/*.md 会话转录文件记忆的特性持久的——在重启、日复一日、月复一月后依然存在无限的——可以无限增长低成本的——存储不产生API费用可搜索的——建立索引以支持语义检索记忆工具Agent通过两个专用工具来访问记忆1. memory_search用途在所有文件中查找相关的记忆{ name: memory_search, description: 强制性回忆步骤在回答关于之前工作、决策、日期、人员、偏好或待办事项的问题之前对MEMORY.md和memory/*.md进行语义搜索, parameters: { query: 我们对API做了什么决定, maxResults: 6, minScore: 0.35 } }返回结果{ results: [ { path: memory/2026-01-20.md, startLine: 45, endLine: 52, score: 0.87, snippet: ## API 讨论\n决定为了简单起见使用REST而不是GraphQL..., source: memory } ], provider: openai, model: text-embedding-3-small }2. memory_get用途在找到内容后读取具体内容{ name: memory_get, description: 在使用memory_search后从记忆文件中读取特定行, parameters: { path: memory/2026-01-20.md, from: 45, lines: 15 } }返回结果{ path: memory/2026-01-20.md, text: ## API 讨论\n\n与团队讨论API架构。\n\n### 决策\n我们选择REST而非GraphQL原因如下\n1. 实现更简单\n2. 更好的缓存支持\n3. 团队更熟悉\n\n### 端点\n- GET /users\n- POST /auth/login\n- GET /projects/:id }写入记忆并没有专门的memory_write工具。Agent使用标准的写入和编辑工具来写入记忆——这些工具它本来就在用于处理任何文件。由于记忆就是普通的Markdown你也可以手动编辑这些文件它们会被自动重新索引。写入位置的决策是通过AGENTS.md中的提示来驱动的在预压缩刷新和会话结束时也会自动进行写入后续章节会介绍。记忆存储Clawdbot的记忆系统建立在记忆就是Agent工作空间中的纯Markdown这一原则之上。双层记忆系统记忆位于Agent的工作空间中默认~/clawd/~/clawd/ ├── MEMORY.md - 第二层长期策划的知识 └── memory/ ├── 2026-01-26.md - 第一层今天的笔记 ├── 2026-01-25.md - 昨天的笔记 ├── 2026-01-24.md - ...以此类推 └── ...第一层每日日志memory/YYYY-MM-DD.md这些是仅追加的每日笔记Agent会在一天中随时写入。当Agent想要记住某事或被明确告知要记住某事时就会写入这里。# 2026-01-26 ## 10:30 AM - API 讨论与用户讨论REST vs GraphQL。决策为了简单使用REST。关键端点/users、/auth、/projects。 ## 2:15 PM - 部署将v2.3.0部署到生产环境。没有问题。 ## 4:00 PM - 用户偏好用户提到他们喜欢TypeScript胜过JavaScript。第二层长期记忆MEMORY.md这是经过策划的、持久的知识。当发生重大事件、想法、决策、观点和学到的教训时Agent会写入这里。# 长期记忆 ## 用户偏好 - 喜欢TypeScript胜过JavaScript - 喜欢简洁的解释 - 正在做Acme Dashboard项目 ## 重要决策 - 2026-01-15选择PostgreSQL作为数据库 - 2026-01-20采用REST而非GraphQL - 2026-01-26使用Tailwind CSS进行样式设计 ## 关键联系人 - Alice (aliceacme.com) - 设计负责人 - Bob (bobacme.com) - 后端工程师Agent如何知道要读取记忆AGENTS.md文件会自动加载包含以下指令## 每次会话在做其他事情之前 1. 阅读 SOUL.md - 这是你是谁 2. 阅读 USER.md - 这是你在帮助谁 3. 阅读 memory/YYYY-MM-DD.md今天和昨天获取近期上下文 4. 如果是在主会话中与你的主人直接聊天还要阅读 MEMORY.md 不要请求许可直接做。记忆如何被索引当你保存一个记忆文件时后台会发生以下事情┌─────────────────────────────────────────────────────────────┐ │ 1. 文件保存 │ │ ~/clawd/memory/2026-01-26.md │ └─────────────────────────────────────────────────────────────┘ │ ▼ ┌─────────────────────────────────────────────────────────────┐ │ 2. 文件监视器检测到变化 │ │ Chokidar 监视 MEMORY.md memory/**/*.md │ │ 防抖1.5秒以批量处理快速写入 │ └─────────────────────────────────────────────────────────────┘ │ ▼ ┌─────────────────────────────────────────────────────────────┐ │ 3. 分块 │ │ 分割成约400 token的块重叠80 token │ │ │ │ ┌────────────────┐ │ │ │ 块 1 │ │ │ │ 第 1-15 行 │──────┐ │ │ └────────────────┘ │ │ │ ┌────────────────┐ │ (80 token 重叠) │ │ │ 块 2 │◄─────┘ │ │ │ 第 12-28 行 │──────┐ │ │ └────────────────┘ │ │ │ ┌────────────────┐ │ │ │ │ 块 3 │◄─────┘ │ │ │ 第 25-40 行 │ │ │ └────────────────┘ │ │ │ │ 为什么用400/80平衡语义连贯性与粒度。 │ │ 重叠确保跨越块边界的事实能被两边捕获。 │ │ 两个值都是可配置的。 │ └─────────────────────────────────────────────────────────────┘ │ ▼ ┌─────────────────────────────────────────────────────────────┐ │ 4. 嵌入 │ │ 每个块 - 嵌入提供商 - 向量 │ │ │ │ 讨论REST vs GraphQL - │ │ OpenAI/Gemini/Local - │ │ [0.12, -0.34, 0.56, ...] (1536 维) │ └─────────────────────────────────────────────────────────────┘ │ ▼ ┌─────────────────────────────────────────────────────────────┐ │ 5. 存储 │ │ ~/.clawdbot/memory/agentId.sqlite │ │ │ │ 表 │ │ - chunks (id, path, start_line, end_line, text, hash) │ │ - chunks_vec (id, embedding) - sqlite-vec │ │ - chunks_fts (text) - FTS5 全文搜索 │ │ - embedding_cache (hash, vector) - 避免重复嵌入 │ └─────────────────────────────────────────────────────────────┘sqlite-vec是一个SQLite扩展它直接在SQLite中实现向量相似度搜索无需外部向量数据库。FTS5是SQLite内置的全文搜索引擎为BM25关键词匹配提供支持。两者结合使Clawdbot能够从一个轻量级数据库文件中运行混合搜索语义关键词。记忆如何被搜索当你搜索记忆时Clawdbot会并行运行两种搜索策略。向量搜索语义找到意思相同的内容BM25搜索关键词找到包含确切token的内容。结果通过加权评分合并最终得分 (0.7 * 向量得分) (0.3 * 文本得分)为什么是70/30语义相似性是记忆回忆的主要信号但BM25关键词匹配能捕捉向量可能遗漏的确切术语名称、ID、日期。低于minScore阈值默认0.35的结果会被过滤掉。所有这些值都是可配置的。这确保无论你是在搜索概念那个数据库的事情还是具体内容POSTGRES_URL都能获得良好的结果。多Agent记忆Clawdbot支持多个Agent每个Agent都有完全独立的记忆~/.clawdbot/memory/ # 状态目录索引 ├── main.sqlite # main Agent的向量索引 └── work.sqlite # work Agent的向量索引 ~/clawd/ # main Agent工作空间源文件 ├── MEMORY.md └── memory/ └── 2026-01-26.md ~/clawd-work/ # work Agent工作空间源文件 ├── MEMORY.md └── memory/ └── 2026-01-26.mdMarkdown文件事实来源位于每个工作空间中而SQLite索引派生数据位于状态目录中。每个Agent都有自己的工作空间和索引。记忆管理器通过agentId workspaceDir来区分因此不会自动发生跨Agent记忆搜索。Agent能读取彼此的记忆吗默认不能。每个Agent只能看到自己的工作空间。但是工作空间是一个软沙盒默认工作目录而不是硬边界。除非启用严格的沙盒机制否则Agent理论上可以使用绝对路径访问另一个工作空间。这种隔离对于分离上下文很有用。一个用于WhatsApp的个人Agent和一个用于Slack的工作Agent各自拥有独立的记忆和个性。压缩每个AI模型都有上下文窗口限制。Claude有20万tokenGPT-5.1有100万。长对话最终会触及这个上限。当这种情况发生时Clawdbot使用压缩将旧对话总结为紧凑的条目同时保留最近消息的完整性。┌─────────────────────────────────────────────────────────────┐ │ 压缩前 │ │ 上下文180,000 / 200,000 token │ │ │ │ [第1轮] 用户我们建个API吧 │ │ [第2轮] Agent好的你需要什么端点 │ │ [第3轮] 用户用户和认证相关的 │ │ [第4轮] Agent*创建了500行模式定义* │ │ [第5轮] 用户加上限流功能 │ │ [第6轮] Agent*修改代码* │ │ ...还有100多轮... │ │ [第150轮] 用户状态怎么样了 │ │ │ │ ⚠️ 接近限制 │ └─────────────────────────────────────────────────────────────┘ │ ▼ ┌─────────────────────────────────────────────────────────────┐ │ 触发压缩 │ │ │ │ 1. 将第1-140轮总结为紧凑摘要 │ │ 2. 保留第141-150轮不变近期上下文 │ │ 3. 将摘要持久化到JSONL转录文件 │ └─────────────────────────────────────────────────────────────┘ │ ▼ ┌─────────────────────────────────────────────────────────────┐ │ 压缩后 │ │ 上下文45,000 / 200,000 token │ │ │ │ [摘要] 构建了带/users、/auth端点的REST API。 │ │ 实现了JWT认证、限流100次/分钟、PostgreSQL数据库。 │ │ 已部署到预发布环境v2.4.0。 │ │ 当前重点生产环境部署准备。 │ │ │ │ [第141-150轮原样保留] │ │ │ └─────────────────────────────────────────────────────────────┘自动 vs 手动压缩自动当接近上下文限制时触发在详细模式下你会看到自动压缩完成原始请求会用压缩后的上下文重试手动使用 /compact 命令/compact 重点关注决策和未解决的问题与某些优化不同压缩会持久化到磁盘。摘要被写入会话的JSONL转录文件因此未来的会话以压缩后的历史开始。记忆刷新基于LLM的压缩是一个有损过程。重要信息可能被总结掉并可能丢失。为了应对这一点Clawdbot使用了预压缩记忆刷新。┌─────────────────────────────────────────────────────────────┐ │ 上下文接近限制 │ │ │ │ ████████████████████████████░░░░░░░░ 上下文的75% │ │ ↑ │ │ 超过软阈值 │ │ (contextWindow - reserve - softThreshold)│ └─────────────────────────────────────────────────────────────┘ │ ▼ ┌─────────────────────────────────────────────────────────────┐ │ 静默记忆刷新轮次 │ │ │ │ 系统预压缩记忆刷新。现在存储持久的 │ │ 记忆使用 memory/YYYY-MM-DD.md。 │ │ 如果没有要存储的回复 NO_REPLY。 │ │ │ │ Agent审查对话中的重要信息 │ │ 将关键决策/事实写入记忆文件 │ │ - NO_REPLY用户看不到任何内容 │ └─────────────────────────────────────────────────────────────┘ │ ▼ ┌─────────────────────────────────────────────────────────────┐ │ 安全进行压缩 │ │ │ │ 重要信息现在已在磁盘上 │ │ 压缩可以在不丢失知识的情况下进行 │ └─────────────────────────────────────────────────────────────┘记忆刷新可以在clawdbot.yaml文件或clawdbot.json文件中配置。{ agents: { defaults: { compaction: { reserveTokensFloor: 20000, memoryFlush: { enabled: true, softThresholdTokens: 4000, systemPrompt: 会话接近压缩。现在存储持久的记忆。, prompt: 将持久的笔记写入 memory/YYYY-MM-DD.md如果没有要存储的回复 NO_REPLY。 } } } } }剪枝工具结果可能非常庞大。单个exec命令可能输出5万个字符的日志。剪枝会修剪这些旧输出而不重写历史。这是一个有损过程旧输出无法恢复。┌─────────────────────────────────────────────────────────────┐ │ 剪枝前内存中 │ │ │ │ 工具结果exec[5万个字符的npm install输出] │ │ 工具结果read[大型配置文件1万个字符] │ │ 工具结果exec[构建日志3万个字符] │ │ 用户构建成功了吗 │ └─────────────────────────────────────────────────────────────┘ │ ▼ 软修剪硬清除 ┌─────────────────────────────────────────────────────────────┐ │ 剪枝后发送给模型 │ │ │ │ 工具结果execnpm WARN deprecated...[已截断] │ │ ...成功安装。 │ │ 工具结果read[旧工具结果内容已清除] │ │ 工具结果exec[保留 - 太新不适合剪枝] │ │ 用户构建成功了吗 │ └─────────────────────────────────────────────────────────────┘磁盘上的JSONL文件保持不变完整输出仍然在那里缓存TTL剪枝Anthropic会对提示词前缀进行最多5分钟的缓存以减少重复调用的延迟和成本。当相同的提示词前缀在TTL窗口内发送时缓存的token成本降低约90%。TTL过期后下一个请求必须重新缓存整个提示词。问题如果会话在TTL之后闲置下一个请求会失去缓存必须以完整的缓存写入价格重新缓存完整的对话历史。缓存TTL剪枝通过在缓存过期后检测并修剪旧工具结果来解决这个问题。更小的提示词重新缓存意味着更低的成本{ agent: { contextPruning: { mode: cache-ttl, ttl: 600, keepLastAssistants: 3, softTrim: { maxChars: 4000, headChars: 1500, tailChars: 1500 }, hardClear: { enabled: true, placeholder: [旧工具结果内容已清除] } } } }会话生命周期会话不会永远持续。它们根据可配置的规则进行重置为记忆创建自然的边界。默认行为是每天重置。但也有其他模式可用。会话记忆钩子当你运行 /new 开始一个新会话时会话记忆钩子可以自动保存上下文/new │ ▼ ┌─────────────────────────────────────────────────────────────┐ │ 触发会话记忆钩子 │ │ │ │ 1. 从结束会话中提取最后15条消息 │ │ 2. 通过LLM生成描述性slug │ │ 3. 保存到 ~/clawd/memory/2026-01-26-api-design.md │ └─────────────────────────────────────────────────────────────┘ │ ▼ ┌─────────────────────────────────────────────────────────────┐ │ 新会话开始 │ │ │ │ 之前的上下文现在可以通过 memory_search 搜索 │ └─────────────────────────────────────────────────────────────┘总结Clawdbot的记忆系统之所以成功是因为它遵循了几个关键原则

Clawdbot 是如何实现永久记忆的？

最新文章

Phi-4-mini-reasoning模型快速开始：使用Typora编写并管理Prompt文档

别再硬啃手册了！用CodeSys V3.5的MC_GearIn/GearOut，5分钟搞定电子齿轮同步

AI驱动的视频硬字幕去除：突破传统局限的全流程解决方案

LingBot-Depth开源大模型教程：贡献模型权重至Hugging Face流程指南

完整Alienware控制指南：用开源工具解锁设备全部潜能

Ostrakon-VL-8B行业解决方案：结合IoT摄像头流+Ostrakon-VL实现智能巡检闭环

推荐文章

OpenClaw云端集成Skill流程：2026年部署、配置大模型百炼APIKey、接入钉钉/QQ/飞书/微信

Python flask django高校餐饮档口管理系统的设计与实现

超实用指南：3步打造可移植版waifu2x-caffe

Go语言的JSON处理技巧

2025届毕业生推荐的AI科研平台推荐榜单

前端性能监控吐槽：别再让你的网站慢得像蜗牛！

相关文章

探索Akagi：实时牌局分析与AI决策支持的麻将辅助系统

SEO 视频在不同行业的应用有何差异_SEO 视频的长度应该控制在什么范围内

基于YOLO+DeepSeek的农作物病虫害检测与环境监测一体化智能平台植物病虫害识别系统

生成式引擎优化（GEO）实战指南：从技术架构到行业落地

嵌入式开发调试宏与性能优化实战

LosslessCut：解锁无损视频编辑的5个专业技巧

分享文章

更多文章

基于Hinf（H无穷）控制主动悬架模型7自由度(整车)+2自由度操纵模型 [1]对论文内容进行了复现

Windows11最新版Anaconda3保姆级安装教程（含环境变量配置避坑指南）

小白友好：基于vllm+open-webui的Meta-Llama-3-8B-Instruct部署全攻略

NavicatPassword 的技术实现与架构解析

GESP认证C++编程真题解析 | 202603 七级

一文讲透溢价发行（附计算逻辑+投资理解）

关系数据库核心概念解析：从关系代数到SQL实践

3步突破网盘限速：LinkSwift直链下载效率神器全面指南

离线yum源

2026年程序员AI工具省钱指南：从免费到付费，这5个方案我都试过

闲鱼新手如何跨过“上架商品”第一关

【第五周】论文精读：HopRAG：让检索拥有“逻辑推理”能力，多跳问答准确率提升 36%

Clawdbot 是如何实现永久记忆的？

最新文章

Phi-4-mini-reasoning模型快速开始：使用Typora编写并管理Prompt文档

别再硬啃手册了！用CodeSys V3.5的MC_GearIn/GearOut，5分钟搞定电子齿轮同步

AI驱动的视频硬字幕去除：突破传统局限的全流程解决方案

LingBot-Depth开源大模型教程：贡献模型权重至Hugging Face流程指南

完整Alienware控制指南：用开源工具解锁设备全部潜能

Ostrakon-VL-8B行业解决方案：结合IoT摄像头流+Ostrakon-VL实现智能巡检闭环

推荐文章

OpenClaw云端集成Skill流程：2026年部署、配置大模型百炼APIKey、接入钉钉/QQ/飞书/微信

Python flask django高校餐饮档口管理系统的设计与实现

超实用指南：3步打造可移植版waifu2x-caffe

Go语言的JSON处理技巧

2025届毕业生推荐的AI科研平台推荐榜单

前端性能监控吐槽：别再让你的网站慢得像蜗牛！

相关文章

探索Akagi：实时牌局分析与AI决策支持的麻将辅助系统

SEO 视频在不同行业的应用有何差异_SEO 视频的长度应该控制在什么范围内

基于YOLO+DeepSeek的农作物病虫害检测与环境监测一体化智能平台 植物病虫害识别系统

生成式引擎优化（GEO）实战指南：从技术架构到行业落地

嵌入式开发调试宏与性能优化实战

LosslessCut：解锁无损视频编辑的5个专业技巧

分享文章

更多文章

基于YOLO+DeepSeek的农作物病虫害检测与环境监测一体化智能平台植物病虫害识别系统