大家好,我是Boris,我在Claude Code工作。我打算开始在X上更活跃一些,因为这里有很多关于人工智能和编程的讨论。 欢迎随时向我反馈 Claude Code 的使用体验或提交 bug 报告。我很想了解大家是如何使用 Claude Code 的,以及我们如何才能让它变得更好。
圣诞节当天,ClaudeCode 背后创造者终于决定:我准备在X上多说点什么了!
25日,被外界视为 ClaudeCode 之父的 Boris Cherny,出来发了一条X帖子,表示之后自己打算在X上活跃起来!
大家好,我是Boris,我在Claude Code工作。我打算开始在X上更活跃一些,因为这里有很多关于人工智能和编程的讨论。 欢迎随时向我反馈 Claude Code 的使用体验或提交 bug 报告。我很想了解大家是如何使用 Claude Code 的,以及我们如何才能让它变得更好。
当天,评论区就炸了,大神 Karpathy 也闻讯过来反馈了一个关于CC token文件上下文限制的问题。很快 Boris 就给出了回复:下一个版本就会新增功能解决。
更重磅的还得是今天一早。这两位大佬又开始互动了。
Karpathy 几个小时前发帖表示,一场 9 级地震正在席卷程序员行业。“作为一名程序员,我从未像现在这样感到自己在掉队。这个职业正在被剧烈地重构。”
为什么这么惊悚?
Karpathy举例说道,程序员真正亲手贡献的那部分代码,正在变得越来越稀疏、越来越零散。
我隐约感觉到,只要能把过去大约一年里出现的这些新能力真正串联起来,我完全可以变得强大 10 倍;而如果没能吃到这波增益,那种挫败感几乎可以明确地归结为“能力问题”。
他提到两点:一个是全新的抽象层技术栈,另一个是覆盖全局的心智模型。
首先,我们现在需要掌握的是一层全新的、可编程的抽象层(而且是在传统技术栈之上再叠一层):它涉及 agents、subagents,以及它们的 prompts、上下文、记忆、模式、权限、工具、插件、skills、hooks、MCP、LSP、斜杠命令、工作流、IDE 集成等等;
其次,你还必须在脑中构建一个覆盖全局的心智模型,用来理解这些本质上随机、可能出错、不可解释、而且持续变化的“实体”的优势与陷阱。
而它们如今,已经与过去那套“老派但可靠”的工程实践彻底交织在一起。
“这感觉就像是某种强大的外星工具被突然发到了每个人手里,但它没有说明书,所有人都只能一边摸索怎么握住它、怎么操作它。”
(不止是编程,小编更有这样的感觉,我甚至对同事说:我发现自己在日益强大的大模型面前,感觉自己的能力越来越渺小。有一种,萤烛之火也敢与日月争辉的感觉~)
CC之父:每周都有这样的感觉
作为开发顶流编程AI产品的 Boris 则很快回应到:+1,而且是几乎每周都有这样的感觉!
并曝料:上个月,自己作为工程师第一次整整一个月都没有打开过 IDE。Opus 4.5 写了大约 200 个 PR,每一行代码都是它写的。
软件工程正在发生根本性的变化,而即便是像我们这样最早的一批使用者和实践者,最难的部分依然是:不断重新调整自己的预期。
而这,仍然只是一个开始。
在10天前,Boris 在一次播客中还表示自己其实会亲自下手编写核心循环的逻辑代码。但很快,Boris 就发现大模型已经厉害到连第一代AI使用者都可能比不过了。
有时候我会开始用“人工”的方式去处理一个问题,然后才提醒自己一句:“Claude 可能就能直接搞定这个。”
Boris 还举了两个对比鲜明的例子。
最近我们在调试 Claude Code 里的一个内存泄漏问题,我一开始又走了老路:连上 profiler,跑应用,暂停 profiler,然后手动翻 heap 分配情况。
与此同时,我的一个同事也在看同一个问题,他的做法是——直接让 Claude 生成一个 heap dump,然后再让 Claude 读这个 dump,去找那些大概率不该被保留的对象。Claude 一次就命中了问题,还顺手提了一个 PR。这样的事情几乎每周都会发生。
Boris 甚至感觉某些方面,新人工程师更有 AI 原生优势。
某种程度上,那些新同事,甚至刚毕业的新人工程师,因为他们对模型“能做什么、不能做什么”没有太多先入为主的判断——也没有那些在使用老模型时形成的“历史记忆”——反而能把模型用得最有效。
要跟上模型能力的变化,其实需要相当多的心理调整成本:几乎每隔一两个月,你就得重新校准一次自己对模型能力的认知,因为模型在写代码和工程能力上的提升实在太快了。
近期一场必看的Boris播客
可以说,Boris 真的如自己所说,越来越公开活跃了。正如上文所说,前不久他还罕见接受了一次采访播客,聊了自己的职业生涯。Boris 之前在 Facebook 工作过,而后随着 ChatGPT 的爆发,催发了他想加入 Anthropic,为这个行业做一点点贡献的念头。
其中小编感受最深的是,一、Boris 是一个很看重“常识”和使命感的工程文化的人。大公司往往由于成熟的组织结构和路径依赖,会把常识拉走;二,ClaudeCode 竟然背后还有一段联合创始人逼着 Boris 往前看的经历。Boris被逼着把视野放长些,“不要为今天的模型做产品,而是要为6个月之后的模型做产品!”
篇幅关系,这里把大家最为关注的Claude Code相关的部分截取了出来,如果想看全部内容,可以走这个传送门。
https://www.youtube.com/watch?v=AmdLVWMdjOk
希望能对身处百忙之中的各位有所启发!
为什么离开Meta加入Claude?
主持人:你离开 Meta 加入 Anthropic,我一直很好奇你当时是怎么想的。
Boris Cherny:我记得第一次用 ChatGPT 的时候,那已经是好几年前了。我当时在日本,一个小镇里只有我一个工程师,也是唯一一个说英语的人,身边完全没有人可以聊技术。每天早上我都会刷 Hacker News。后来用了 ChatGPT,真的被震住了。那种感觉——现在大家可能已经习以为常了,但当时的大模型真的像魔法一样,是一种不可思议的技术。后来我的看法又变了:在我看来,大模型更像是一种“外星生命形式”,我们在把它们培育出来、带到这个世界上,它不只是技术而已。
我自己也读很多书,尤其是科幻小说。那是我最喜欢的类型。所以当时我就在想:“天哪,我一定要参与到这个东西里。”于是我开始琢磨,哪些实验室在做这件事,就去和在不同实验室工作的朋友聊。等我来到 Anthropic,我还记得第一次午餐,是和联合创始人之一 Ben,还有一群同事一起。我提到了一本科幻书,挺冷门的,应该是 Greg Egan 写的那种硬科幻。我以前几乎没遇到过读过这本书的人。我随口讲了书里的一个情节,结果桌上所有人都说:“对对,那本不错,但你看过另外那本吗?”那一刻我就意识到,这是一个由一群重度科幻迷组成的团队,是一群会对我关心的这些问题进行极深思考的人。
还有一点是,读多了科幻,你会对这些技术可能走向哪里形成一种直觉性的想象。AI 对社会的影响太具颠覆性了。它现在首先冲击的是工程领域,但它会波及社会的每一个角落,影响一切。我们现在看到的,只是第一波浪潮。我读得够多,也大概知道这件事可能走向哪些糟糕的结局,出问题的方式太多了。所以对我来说,Anthropic 几乎是一个显而易见的选择——我想待在一个地方,哪怕只是以工程师的身份,尽我所能让这件事往好的方向发展。
说起来也挺有意思的。加入之前,我对“安全”是认真对待的,但更多是一种抽象概念。在 Meta,安全常常被视为一种“税”,是完整性团队推着你做的事,但很少有人真正为此感到兴奋,因为它不是产品本身。这就是我以前对安全的理解。但我同时也隐约觉得,它可能完全不是这么一回事。到了 Anthropic 之后,我发现真的完全不同。每一个新模型发布,我都会看到它带来的新风险;我也看到公司如何真正“言行一致”——有多少算力投入到安全与对齐研究,有多少人在做这件事。我们过去甚至因为无法确认模型是否安全,而推迟过发布,直到确认安全为止。
像 Opus 4 这种模型,风险就陡然上升了。如果模型能够设计生物病毒,能做这些极其危险的事情,那风险已经完全不是一个量级了。早期模型的基线风险可能还是选举操纵之类的问题,那在当时已经是大事了。但随着模型能力不断增强,风险迅速升级,人们开始可以用模型去制造真正威胁人类的东西——不是某个国家的政治问题,而是关乎人类存续本身。这不是科幻,这是当下真实存在、我们必须正面应对的风险。所以能参与其中,哪怕只是贡献一点点,这件事本身就已经足够让我下定决心。
Anthropic的工程文化:常识和使命感
主持人:
那你刚加入的时候呢?从你之前待过的工程文化,到 Anthropic,有没有让你感到很“冲击”的差异?
Boris Cherny:
我觉得主要有两点。第一是,作为一家仍然处在创业阶段的公司,这里充满了常识。这是所有大公司都会逐渐失去的东西——决策者离决策影响越来越远,不管是对产品还是对人,于是就需要各种流程把他们拉回来,提升决策质量。但在一家创业公司里,大家天然就有常识,通常都会去做“对的事情”。我不需要花太多时间去说服别人,只要事情该做,大家一看就明白,然后就去做了。
第二点,对我个人来说,真正驱动我的,是使命感。这一点极其重要,也是我每天愿意、而且兴奋地去上班的原因。它让我在周末写代码,不是因为有截止日期,而是因为我真的想做这件事。我在 Facebook Groups 时期其实也很有这种感觉,那里的使命感很强。当时的 VP Jen Dolski 曾是 change.org 的 CEO,她几乎是把 Facebook Groups 当成一家非营利组织来运营,有一整套“改变理论”,讲的是如何把志同道合的人连接起来、形成社区,那种感觉非常有激励性。到了 Instagram,也许是地理距离,也许是别的原因,我始终没有找到同样强烈的使命感。但在 Anthropic,这种感觉非常强烈,对我来说,这可能是最让人兴奋的一点。
被创始人逼着放大视野,为6个月之后的模型做产品
主持人:
我知道你被认为是 Claude Code 的创造者,这个故事你在很多地方都讲过了。但我更好奇的是,当年 Claude Code 出现的时候,内部环境到底是什么样的。我之前和一个朋友聊起这件事,当时其实已经有不少接入模型的竞品工具了。你觉得,Claude Code 到底有什么不同,为什么它能脱颖而出,并且在内部迅速“野火般”扩散开来?
Boris Cherny:
在那个时间点,大家对“写代码”这件事的想象完全不一样。如果你当时提到 AI 编程,大多数人想到的就是自动补全,仅此而已。可能有一些非常早期的 agent,但那更多是自动补全之外的附属品,很多时候还是被当作问答工具在用,并不是真正用来写代码。所以当时大家心里的 AI 编程产品形态,其实就是“按 Tab 自动补全”。我当时也是这么想的,觉得这差不多就是全部了。
后来是 Ben——当时我的经理——逼着我把视野放大一点。我觉得他是真的把“规模定律”内化进去了。毕竟他从 Anthropic 创立之初就在,也在其他实验室待过,所以他很清楚模型能力会以多快的速度提升。他当时对我施加了很大的压力:不要为“今天的模型”做产品,要为“六个月后的模型”做产品。
说实话,在很长一段时间里,Claude Code 并不是一个好用的产品。即便在内部,我可能也就用它写了 10% 左右的代码,偶尔用用,但模型能力不够,大多数事情它还做不了。直到后来我们发布了 Sonnet 和 Opus 4——我记得大概是今年三月——产品突然就“跑通”了。这一点无论是使用数据,还是我自己的编程体验,都非常明显。我开始能用它写大概一半的代码。而这完全验证了当初的判断:那正好是项目启动六个月之后。
现在,Claude Code 本身大概有 80% 到 90% 的代码是用 Claude Code 写的。如果你看 Anthropic 内部的一些团队,有的团队 90% 的代码都是通过 Claude Code 完成的,而且不只是我们这一组。如果看整体生产力,Anthropic 今年以来规模大概翻了三倍,但按你刚才提到的那种“每工程师成本产出”来衡量,人均生产力几乎提升了 70%,而这基本上就是 Claude Code 带来的结果。
所以作为一个做产品的人,我通常会往前想一步;而在实验室里,你反而要用一种不太一样的方式思考——既不是想两步之后,而是非常清楚模型本身,以及我们正处在一条指数级增长曲线上。
自己有一套大模型的组合用法
主持人:
你看了 Karpathy 最近的那次采访吗?
Boris Cherny:
还没来得及看。
主持人:
他说了一点挺有意思的内容,也算是一种“反向提醒”。他说 vibe coding 虽然能带来很多看起来很神奇的结果,但同时也会产出不少“垃圾”——或者说,有一些隐性的代价。所以我很好奇,当模型生成了大量代码,但结果并不完全符合你的预期,甚至埋着一些不那么明显的问题时,你是怎么思考和应对的?
Boris Cherny:
AI 编程和我们使用的其他工具一样,本质上是一种工具,而工具是需要学习怎么用的。Karpathy 本身当然非常会写代码。我觉得很多刚接触这类工具的人,常犯的一个错误是:一上来就让模型做太大的事情,或者对模型写出来的代码,和对自己写的代码,设定了不一样的标准。
在 Claude Code 团队里,我坚持的一点是:无论代码是模型写的,还是人写的,标准完全一样。如果代码不行,我们就不会合并;标准只有一个。然后你就让模型继续改,把代码变好。
另外,这类工具的“使用方式”其实有很多种。有时候你确实可以 vibe coding,这在写一次性代码、原型代码、或者不在关键路径上的代码时非常重要。我自己也经常这么做,但这绝对不该成为唯一模式。因为在很多场景下,你需要的是可维护的代码,需要对每一行都非常谨慎。不同的问题,本来就应该用不同的方法。
我自己通常会有一套组合用法。有时候会 vibe coding,但其实挺少的,主要用在原型或即弃代码上。更多的时候,我是和模型“结对”写代码。我们先对齐一个计划——在 Claude Code 里就是用 Shift+Tab 进入计划模式。模型先给出计划,我再看代码,然后让它改进、清理,整个过程非常深入,是我和模型一起协作完成的。
当然,有些地方我还是会自己手写。比如在核心查询循环的一些部分,我对参数命名、某一行代码具体写在哪里都有很强的主观判断,这种时候我就会直接自己写。
整体来说,我认为模型目前在“写代码”这件事上还远谈不上优秀,提升空间非常大。但这已经是它“最差”的状态了。回头看一年前,AI 编程还只是预测式输入,而现在已经完全是另一个世界了。再想想接下来几个月、几年会发生什么,这条轨迹本身就足够让人兴奋。对我来说,真正让我持续保持热情的,就是对这条演进路径的清晰认知。
当人们听到 Claude Code,第一反应往往还是“写代码”,但其实它指向的远不止这些。
不止编程,万物皆可ClaudeCode
主持人:
不过,Claude Code 的用途显然不只是软件工程本身。比如数据科学家用它来查询数据。当你把 Claude Code 放在“万物皆可用”的语境下,你是怎么想的?
Boris Cherny:
这件事对我来说真的挺疯狂的。我记得大概六个月前,我走进办公室,看到我们的数据科学家 Brandon 在电脑上开着 Claude Code。他就坐在我们旁边。我问他:“哥们,你在干嘛?是在试用吗?”他说:“不是啊,这是我在干活。”我当时直接愣住了。
他自己摸索着学会了怎么用终端、怎么装 Node.js,然后装了 Claude Code,接着就开始写一堆 SQL,帮他做数据分析。现在我再从数据科学家那一排走过去,几乎每个人屏幕上都同时开着好几个 Claude Code 窗口,已经不是一个了。他们在干各种事情:写 SQL、跑数据、写 DBT pipeline,也在写代码。
所以我觉得,除了“写代码”之外,还有大量的应用场景。看到大家用它来做各种事情,真的很酷。甚至还有完全不算技术背景的用户——在 Anthropic,差不多一半的销售团队都在用 Claude Code 工作。他们可以把它接到 Salesforce,接各种数据源,然后直接完成自己的工作。这完全不是我们最初设计它时的预期,也不是最初的使用意图。
不要被竞品带跑偏
主持人:
当我听到 Claude Code 的时候,也会想到 Codex,它算是你们最大的竞争对手之一。我挺好奇的,你怎么看和 Codex、OpenAI 的竞争?Claude Code 做得更好的地方是什么?另外,这类 AI 产品的“黏性”从哪里来?是什么让用户留在 Claude Code,而不是转去 Codex?
Boris Cherny:
说实话,我也不太确定。我自己并不怎么用其他产品。
对我来说,我一直跟团队强调的一点是:太容易被竞争对手带跑偏了。我在大公司里见过这种失败模式很多次——竞争者一多,你就会忍不住去看他们在做什么,然后照着抄。这样做很容易,但真正难的是想出新的点子,用更好的方式解决用户的问题。
所以我一直很刻意地提醒团队:不要被其他产品分散注意力。产品永远会有很多,竞争者越多,其实越说明我们做对了一些事情。我们真正要保持高度聚焦的,是解决我们自己的问题,解决 Anthropic 研究人员的问题,以及解决用户的问题。
编程是一门实操学问
主持人:在快结束之前,我想问几个关于职业发展的回顾。一个我注意到的点是,你并没有计算机科学背景,却成长为一名非常强的软件工程师。你有没有在某些阶段觉得这件事限制过你?还是你觉得它其实并不重要?
Boris Cherny:我学的是经济学,后来为了创业直接辍学了。对我来说,不管做什么,真正的学习都发生在工作中。编程是一项极其偏实践的技能。我很难想象,在学校里学到的那些东西,比如数据结构课程,如果你从来没真正做过产品,那到底有什么现实意义?
所以我给别人的建议通常是:用非常实用的方式去学编程。这是一门实操技能。如果之后你想回过头来补理论,再去学就好。就我个人而言,我从来没有觉得没有 CS 学位这件事拖过我的后腿。
高效的核心秘诀:Agent
主持人:
那说说生产力吧。我看到你说自己基本是朝九晚六,而且只用两根手指打字,但你的产出却非常惊人。你有很多 side project,主线工作也一点不轻松。你的核心效率秘诀是什么?
Boris Cherny:
现在的答案,和几年前会完全不一样。现在的“秘诀”其实很简单:学会用 Claude Code,学会同时跑一堆 Claude Code 去干活。
比如我们前几周刚上线插件功能,Daisy 是负责这个的工程师之一。她直接让一堆 Claude Code 帮她建看板、拆任务,然后开了一个“群”,大概 20 个 Claude Code,在一个周末里一起写插件。她把它们跑在 Docker 容器的危险模式下,几天就搞定了。这种工作方式,我觉得就是工程的未来。
所以现在谈生产力,本质上是学会用 Claude 来自动化那些重复劳动,也学会让多个 Claude 一起协作完成工作。你更像是在编排,而不是手写所有代码。
如果是几年前,我的建议可能会很不一样,会更偏向于时间管理、专注时段之类的传统方法。
主持人:
这也让我想到一个问题:Claude Code 会不会改变我们常说的“创造者日程”和“管理者日程”的区别?听你刚才描述,工程师好像越来越像管理者,手里有一支 Claude Code 的“队伍”,不再依赖长时间深度专注,而是频繁在很多事情之间切换。你现在还会有大块的专注编码时间吗?
Boris Cherny:
比以前少了。我现在也会在周末写代码,因为我很喜欢那种安静的时间。但平时的话,我每天早上基本都是打开 Claude Code——包括手机端。我们这周刚发布了一个新的版本,里面有一个 Code 标签,其实内部已经用了一段时间了。
所以我每天醒来,第一件事就是启动几个 agent,让它们先帮我把当天要写的代码跑起来。
这真的很疯狂。如果你在六个月前问我,我会不会用这种方式写代码,我大概会说:“你疯了吗?怎么可能这样写代码?”但事实证明,它真的可行。它已经在这里了,而且确实能跑起来,这已经成了我现在写大量代码的方式。我通常会先启动几个 agent,等我真正坐到电脑前,再去看进度。有时候代码看起来没问题,我就直接合并;有时候我会拉到本地,像“瞬移”一样稍微改几下。
而且你之后会和 Fiona 聊到。从她跟我说的情况来看,她已经差不多十年没写过代码了,但现在却每周都会写好几次。作为一名管理者,她的日程非常疯狂,但她依然可以用手机 App、用 Web 端,甚至直接开个终端,随手就能写点代码。
所以,是的,这真的太不可思议了。我们正亲身经历这样一次转变:我们一直以来做的事情、我成长过程中熟悉的那套方式,正在发生彻底改变。而且这件事真的很酷——写代码这件事,正在变得对所有人都可达。
不要路径依赖,要保持常识
主持人:
最后一个问题。以你现在对职业发展的理解,如果你能回到刚入行的自己,给当时的自己一些建议,你会说什么?
Boris Cherny:
用常识行事。我觉得尤其是在大公司里,有太多东西会把你从常识中拉走。各种组织结构、路径依赖,“事情之所以这么做,是因为一直以来都是这么做的”。还有很多激励机制并不对齐。当然,大公司也有很多好东西,但这些问题同样存在。
所以,保持常识非常重要。职业早期我做过不少创业项目,也在很多初创公司待过,在那些地方也是一样的道理:用常识去判断市场真正想要什么,用户真正需要什么,然后去做。总之,信任自己,慢慢培养并打磨你的常识判断力。
主持人:
太棒了。非常感谢你,Boris,抽出时间来分享,真的很感激。
Boris Cherny:
谢谢,谢谢你。
如果你想更深入地学习大模型,以下是一些非常有价值的学习资源,这些资源将帮助你从不同角度学习大模型,提升你的实践能力。
一、全套AGI大模型学习路线
AI大模型时代的学习之旅:从基础到前沿,掌握人工智能的核心技能!
因篇幅有限,仅展示部分资料,需要点击文章最下方名片即可前往获取
二、640套AI大模型报告合集
这套包含640份报告的合集,涵盖了AI大模型的理论研究、技术实现、行业应用等多个方面。无论您是科研人员、工程师,还是对AI大模型感兴趣的爱好者,这套报告合集都将为您提供宝贵的信息和启示
因篇幅有限,仅展示部分资料,需要点击文章最下方名片即可前往获取
三、AI大模型经典PDF籍
随着人工智能技术的飞速发展,AI大模型已经成为了当今科技领域的一大热点。这些大型预训练模型,如GPT-3、BERT、XLNet等,以其强大的语言理解和生成能力,正在改变我们对人工智能的认识。 那以下这些PDF籍就是非常不错的学习资源。
因篇幅有限,仅展示部分资料,需要点击文章最下方名片即可前往获取
四、AI大模型商业化落地方案
作为普通人,入局大模型时代需要持续学习和实践,不断提高自己的技能和认知水平,同时也需要有责任感和伦理意识,为人工智能的健康发展贡献力量