13 万星的 GitHub 神器让 GLM-5.1 直接起飞,3 天烧了 1 亿 Token。

张开发
2026/4/4 22:49:52 15 分钟阅读
13 万星的 GitHub 神器让 GLM-5.1 直接起飞,3 天烧了 1 亿 Token。
GLM-5.1-Turbo 刚用上没几天。就收到一条短信智谱 Coding Plan 支持 GLM-5.1 模型了。马上给我的 Claude Code 切换上狂用了两天烧了几亿 token。我发现GLM-5.1 不是 .1 的简单升级而可能是一个断代。尤其是在长程任务上的表现GLM-5.1 真的牛逼。看了一下 Artifical Analysis、SWE Bench 这些核心榜单目前 GLM-5.1 是开源第一。而且 GLM-5.1 Superpowers 插件绝配。想体验的可以看看智谱 Coding Plan如果你是新用户下单立减 5% 金额。不过现在得抢了每天早上 10 点。链接https://www.bigmodel.cn/glm-coding?icUX7NF0VZ4S01快用起来我在 Claude Code 中跑了三个不同类型的任务每一个都涉及多步骤、长链路、持续执行。它从第一步到最后一步GLM-5.1全程没有跑偏。从 0 开发一个支持 Web 和 CLI 的笔记工具这几天用起来Superpowers 开源神器 GLM-5.1 从 0 到 1 开发应用真的太顶了。比如我先使用 brainstorming 进行前置讨论确定需求范围、技术选型、实现方式等一系列重要的事儿。前置的讨论非常重要一定不要略过。① 前置头脑风暴我输入从零开发一个类似 memo 的本地笔记工具支持 Web 端笔记创建、编辑、删除、搜索。同时提供 CLI 命令可以在终端里面操作笔记。支持标签系统数据保存到本地。这个简短的提示词输入后GLM-5.1 不会直接干活。而是先和你对话确认需求范围、确认技术选型和前端框架。它会先和你头脑风暴直到所有未确认的细节都拿到了。有意思的是它不确定哪种交互是你喜欢的。它会确认核心界面的 UI 时直接生成一个临时的网页让你看着选。② 开始写计划等头脑风暴完它就开始写一个详细计划。这个计划是会落实到文件中的。我看了一下计划没问题我就去吃烤肉了。告诉 GLM-5.1 计划没问题你开搞吧。我先去吃饭了。③ AI 开始干活儿写完计划启动了多个子 Agent完成了整个项目的开发。整个流程我没有任何人工介入。也介入不了我吃烤肉呢。GLM-5.1 在我吃饭的时候做了下面这些事儿。等我吃完回来告诉我搞定了④ 体验一下加上前面的头脑风暴一共 1h。这个 46 个文件5258 行代码的 memo 小工具就做好了。一次验证通过。部署后所有核心功能都可用。创建/编辑/删除笔记、标签自动解析、全文搜索、日历视图、CLI 操作等。CLI 操作支持10 万条用户数据做场景分析这是一个数据分析任务。这是很多产品、运营、数据同学每日的工作。我本地有一个 CSV 文件里面是10 万条用户的文件名称数据。任务目标是让 AI 读取这些数据基于文件名称做用户使用场景分类然后输出洞察。这个任务配合 Claude Code 的 Superpowers 插件效果也挺好。我现在已经把 Superpowers 的头脑风暴模式当成一个大号的 Plan Mode 了。再做复杂的任务之前都先和它头脑风暴一下。它会基于目前的背景不断询问你然后明确你真实的诉求。在让我澄清了 5 次给到我 3 个分类方案后。它自己去对这 10 条用户数据进行打标最后交付给我一个非常详细的分析报告。遇到问题自己处理、不把问题甩给你的行为模式是长程任务里最稀缺的能力。我在 GLM-5.1 中看到了。开源项目 PR/Issues 批量管理我给它一个开源仓库让它把所有 Open 的 PR 读一遍然后给出一个完整的管理方案。听起来不复杂但实际操作链路很长遍历 PR、逐条评估、冲突解决等等需要输出一份完整的执行计划。整个任务它自主规划了 40 步持续执行了约 11 分钟消耗了大概 1800 万 Token。中间有几个让我印象很深。它会很仔细有很多你意想不到的周全。除了更新功能它的计划里还有同步更新中文和英文的 ReadMe 文件。而且最后还会给提 PR 的开发者一个评论反馈比如非常感谢您提的 PR我已经合入之类的。02怎么用上 GLM-5.1如果你是 Coding Plan 用户现在已经在 Claude Code 里面用 GLM 模型了两个方法方法一手动配置找到你的 Claude Code 配置文件~/.claude/settings.json把 model 字段改成glm-5.1保存即可。方法二用 CC Switch 一键切换CC Switch 是一个开源的桌面端 AI Coding 工具管理器。能统一管理 Claude Code、Codex、Gemini CLI、OpenCode、OpenClaw 五个工具的 Provider。直接点击右上 号填写进去你的 Coding Plan 的 API key和模型名称 glm-5.1 就行了。另外没买过智谱 Coding Plan 的读者如果你是新用户通过下面链接下单立减 5% 金额。每天早上 10 点开始抢https://www.bigmodel.cn/glm-coding?icUX7NF0VZ4S03为什么是长程任务聊完实测说说 GLM-5.1 背后的逻辑。GLM-5.1 是面向长程任务的开源第一模型用起来媲美 Claude 的 opus模型。不是通用能力最强不是单轮问答最准而是长程任务。这个方向选得很准。因为 AI Coding 正在经历一条非常清晰的能力跃迁路径第一阶段AI Coding模型学会写代码本质上是程序员的效率工具。写个函数、补段逻辑它是个好用的助手。第二阶段Vibe CodingCoding 从专业行为变成大众表达方式。你不需要理解每一行代码但可以借助工具把想法快速变成原型。Code is cheapIdea 的价值开始凸显。第三阶段AgenticAI 不再只是写代码片段而是能自主理解需求、制定计划、编写代码、测试并迭代修复。像一个初级工程师。第四阶段Long Horizon 真实世界里最有价值的任务不是一句提示词、一次调用能解决的。它们需要跨步骤、跨工具、跨时间地持续推进需要记住上下文保持目标一致处理中途的意外并在必要时修正路径。GLM-5.1 就是冲着第四阶段去的。再狂烧了几亿 token 后我在想 AI 时代中人类更擅长的到底是什么。之前以为是判断、方向等等一些很虚的东西。但是 Opus 4.6 和 GLM-5.1 这种模型出来后 感觉 AI 不仅仅是替代你的手现在也开始替代你的脑了。你给它一个目标它自己拆步骤、自己推进、中间出了问题自己修、最后给你一个完整交付。而且中间很多判断确实比人力更好。只要给出它足够的上下文AI 做的决策一定最优。06点击下方卡片关注逛逛 GitHub这个公众号历史发布过很多有趣的开源项目如果你懒得翻文章一个个找你直接关注微信公众号逛逛 GitHub 后台对话聊天就行了

更多文章