石嘴山市网站建设_网站建设公司_版式布局_seo优化
2026/1/20 6:07:29 网站建设 项目流程

文章来自anthropic的分享,dont build agent,build skill instead。

01

破除“智能”幻觉:我们过度设计了逻辑,却忽略了经验

在 AI Agent 的开发一线,最令人沮丧的并非模型的“幻觉”,而是其 不稳定性(Inconsistency) 。开发者们往往陷入一种怪圈:堆砌冗长的 System Prompt,设计复杂的 Few-shot 示例,构建繁琐的重试机制,但 Agent 在执行特定任务时依然像个捉摸不定的实习生。

我们面临的核心矛盾在于:我们拥有的是高智商的机器,而非有经验的专家。 我们过度设计了推理逻辑,却在“经验标准化”上投入太少。 Anthropic 提出的“技能(Skill)”范式,正是要实现 智能与逻辑的解耦 ,将不确定的 AI 推理转化为可重复的工程资产。

02

博学者还是专业人士?一致性胜过高智商

在商业落地中,企业真正需要的是什么?Anthropic 的工程师 Barry Zhang 和 Mahesh Murag 提出了一个尖锐的对比:

面对 2025 年的报税任务,你会选择谁?

Mahesh:

智商 300 的天才,能从第一性原理推导数学逻辑,但对税法一窍不通。

Barry:

拥有 20 年经验的资深税务专家。

答案显而易见。你不需要天才在你的税单上现场推演税法,你需要的是 稳定、一致的行业经验执行 。当前的 Agent 瓶颈在于它们太像 Mahesh:聪明、灵活,但每次任务都是一场“即兴发挥”。

正如技术专家 Jiang Yanqing 所言:“你不会希望在报税时让天才从零开始推导税法。”商业价值往往诞生于“一致性”而非“灵感”。

03

文件夹即技能:回归文件系统的极简力量

Anthropic 对“技能”的定义极其硬核且实用: 技能是一组组织的文件夹(Collection of files),其核心是一个 SKILL.md 文件。

这并非简单的重命名,而是一次架构层面的范式转移:

代码作为通用接口:

模型不再仅仅是通过对话进行交互,而是通过运行环境(Runtime)操作文件系统和执行脚本。这种“薄脚手架(Thin Scaffolding)”设计,让 Agent 的核心逻辑简化为 Bash 指令和文件操作。

解耦 MCP 与技能:

这是一个关键的架构界限。 MCP (Model Context Protocol) 负责“管道连接(Plumbing)” ,即与外部世界的连接性;而 技能(Skills)负责“大脑专业知识(Expertise)” ,即程序化知识的封装。

可重用的经验包:

技能可以包含脚本(Python/Bash)、二进制文件或资产。当 Claude 发现自己反复编写同样的样式处理脚本时,它可以将其保存为“技能”,供“未来的自己”直接调用。这种可迁移的学习(Transferable Learning)让 Agent 具备了跨session的记忆。

04

渐进式披露:保护昂贵的上下文窗口

为了让 Agent 能够扩展到拥有成百上千项技能,Anthropic 引入了 渐进式披露 (Progressive Disclosure) 机制。

在运行时,模型最初仅感知到技能的 元数据(Metadata) ——即知道自己“有这个能力”。只有当任务触发该技能时,Agent 才会读取 SKILL.md 中的详细核心指令。这种模块化设计确保了有限的上下文窗口(Context Window)不会被无关的工具说明填满,实现了真正的可组合性。

05

新计算堆栈:模型是处理器,技能是应用

AI 架构正迅速向传统计算机系统靠拢。我们可以清晰地定义这个新堆栈:

传统计算组件

AI Agent 架构

角色定义

处理器 (Processor)

模型 (Models)

廉价且通用的计算力

操作系统 (OS)

运行环境 (Runtime)

管理 Token 输入输出与文件系统

应用程序 (Applications)

技能 (Skills)

核心价值:封装的领域经验

行业共识正在形成:“智能是廉价的,技能是稀缺的 (Intelligence is cheap, Skills are scarce)”。

企业的护城河将不再是模型本身,而是那一组组封装了专有工作流、品牌规则和机构习惯的 SKILL.md 库。

06

确定性的力量:非技术人员的“超能力”

“技能”范式的最大红利在于:它赋予了业务专家(如财务、法务、招聘人员)直接“教导”AI 的能力。这种转变带来了“可信的枯燥感(Trustworthy Boringness)”。

以 Jiang Yanqing 的“下一代分析 Agent”为例:

不再自创定义:

通过 SKILL.md 预设 SQL 模板,Agent 必须执行经过审计的指标定义(如毛利率计算),而非现场发挥。

人机协同(Human-in-the-Loop):

技能可以声明 必需参数 。如果用户提问中缺失关键维度(如时间跨度),Agent 会触发 UI 提示。

这种从“自由创作”到“执行剧本”的转变,已经在生命科学(Cadence 的 EHR 数据分析)和企业协同(Notion 的工作空间研究)等领域产生实效。

07

结语:从“构建 Agent”到“教导 AI”

我们正处于从“重复造 Agent 轮子”转向“沉淀组织知识”的拐点。 SKILL.md 的标准化格式确保了知识的持久性:Claude 今天写下的逻辑,可以被未来更强大的模型版本直接继承。

未来的 AI 员工,入职第一天就应拥有访问团队“技能文件夹”的权限。它无需重新学习,因为它加载的是你团队累积数年的最佳实践。

一个启发性的问题: 当智能变得唾手可得,你的组织有哪些不可替代的、累积多年的“行业经验”,值得被立即编码进 SKILL.md 中?

需要专业的网站建设服务?

联系我们获取免费的网站建设咨询和方案报价,让我们帮助您实现业务目标

立即咨询