西安市网站建设_网站建设公司_HTML_seo优化
2025/12/26 3:26:41 网站建设 项目流程

2025 年底,中美 AI 界两位顶尖人物不约而同地发布了对 2026 年大模型的深度思考。

一位是唐杰,清华大学教授、智谱 AI 首席科学家,代表了国内最懂大模型落地的工程视角; 一位是Andrej Karpathy,OpenAI 联合创始人、前特斯拉 AI 总监,代表了硅谷最前沿的技术哲学视角。

将两人的观点重叠在一起,我们惊讶地发现:尽管一个是“清华理工男”的严谨逻辑,一个是“硅谷极客”的天马行空,但在核心判断上,他们达成了惊人的共识。

这也是我整理这篇文章的初衷:在这个充满噪音的时代,听听最聪明的大脑在想什么,能帮我们看清 2026 年的方向。

在展开长文之前,有一句话必须置顶高亮。这是唐杰教授提出的观点,也是对所有 AI 从业者的一记当头棒喝:

“AI 模型应用的第一性原理不应该是创造新的 App,它的本质是 AGI 替代人类工作。因此,研发替代不同工种的 AI 才是应用的关键。”

如果你还在绞尽脑汁想做一个什么“AI+X”的新产品,请停下来反复咀嚼这句话:AI 的终局不是工具,而是员工。

以下是两人观点的深度融合与复盘。

01 训练范式剧变:从「背书」到「做题」

过去几年,我们训练大模型像是在“填鸭式教育”:喂更多的数据(预训练),让它背诵世界的知识。

唐杰指出:预训练没死,但它不再是唯一的主角。光有智商(预训练)不行,现在的模型容易“偏科”。为了刷榜单(Benchmark),很多模型在做题,但在真实复杂的场景下却无法解决问题。

Karpathy进一步揭示了 2025 年最大的技术变量——RLVR(可验证奖励的强化学习)。 这标志着训练范式的根本性升级:

  • 以前(SFT):老师给标准答案,模型照葫芦画瓢。

  • 现在(RLVR):把模型扔进水里,只要能游到对岸(得出正确结果),不管你用什么姿势。

这种变化让模型产生了一种类似“顿悟”的能力。它开始学会把大问题拆解、学会自我反思、学会走错了回头重来。

共识:预训练是让模型读完九年义务教育,而接下来的重点是“中后训练”(Mid/Post-training),是把模型扔进残酷的职场(真实场景),让它在不断的试错和反馈中学会真正的推理。

02 智能的本质:从「理论博士」到「打工人」

模型读了那么多书,为什么还是干不好活?

唐杰用了一个非常精准的比喻:

“如果没有 Agent 能力,大模型就是个‘理论博士’。书读得再多,如果不能动手解决问题,那也只是知识的容器,产生不了生产力。”

Agent(智能体)就是让模型从“会说”进化到“会做”的关键。

Karpathy对此有着同样的观察,但他更进了一步。他认为 Agent 不应该只是云端的 API,而应该“住在你的电脑里”。 他以 Claude Code 为例,强调未来的 AI 就像你电脑里的一个小精灵:它能直接操控你的终端,能读取你的本地文件,能像一个坐在你身边的程序员一样,和你并肩作战。

警示:唐杰特别提到,领域大模型可能是个伪命题。 企业想用领域 Know-how 构建护城河,把 AI 驯化为工具。但在 AGI 的海啸面前,一切领域壁垒最终都会被卷入主模型。所谓的“行业专用”,可能只是通往 AGI 路上的一座临时避难所。

03 应用的真相:Vibe Coding 与工种替代

这是对普通人影响最大的一层逻辑。

Karpathy发明了一个新词:Vibe Coding(氛围编程)。 意思是,你完全不需要懂代码,只需要用自然语言描述你的需求(Vibe),AI 就能把程序写出来。代码变得像草稿纸一样廉价、即用即弃。

这不仅仅是编程方式的改变,而是生产关系的重构。

这就回到了唐杰那句振聋发聩的“第一性原理”:

  • 创业者的误区:我要开发个什么软件给用户用?

  • 正确的思考:我要造一个什么样的 AI 员工,去把某个岗位的人力成本砍掉?

Chat 已经部分替代了搜索,下一步就是替代客服、替代初级程序员、替代数据分析师。 2026 年的爆发点,不在于诞生了多少新 App,而在于“Cursor for X”——即各行各业都会出现像 Cursor 替代程序员一样,去替代其他工种的 AI 形态。

04 下一个瓶颈:记忆、在线学习与“参差不齐”

未来虽然美好,但两位专家都保持了极度的清醒,指出了当下的硬伤。

1. 记忆是刚需,但还没做对

唐杰指出,模型不仅要有短期的 Context(便签纸),还需要像人类一样的海马体(中期记忆)和大脑皮层(长期记忆)。目前的 RAG(检索增强)只是权宜之计,真正的长期记忆需要模型能实时更新自己的参数——这目前还是未解难题。

2. 参差不齐的智能(Jagged Intelligence)

Karpathy提醒我们,AI 不是在养动物,而是在“召唤幽灵”。因为优化目标不同,AI 的智力极度不均衡:它上一秒像个全知全能的学者推导复杂公式,下一秒就可能犯小学生都不会犯的低级错误。 这种“锯齿状”的智力分布,是目前大规模商用的最大隐患。

3. 在线学习(Online Learning)

现在的模型是“离线”的,训练好就不变了。唐杰认为,下一个 Scaling 范式可能在于让模型具有“自我评估”的能力——知道自己对不对,才能在工作中边用边学,越用越聪明。

结语:2026 年的路线图

把唐杰和 Karpathy 的观点拼在一起,我们得到了一张清晰的路线图:

  • 当下:预训练依然有效,但重心转移到了 RLVR 和后训练,提升模型的“推理”和“做题”能力。

  • 近期:Agent 是突破口,目标是让 AI 具备“手脚”,从云端落地到本地,从聊天框进入操作系统。

  • 中期:解决记忆和在线学习,让模型具备自我迭代的能力。

  • 长期:工种替代。所有中间形态的工具软件,最终都将被“AI 员工”取代。

正如 Karpathy 所说:“大模型比我预期的聪明,也比我预期的蠢。”

2025 年,泡沫会挤出,但技术在加速。对于我们每一个人来说,思考的维度不应再是“如何使用工具”,而是“如何管理你的 AI 员工”。

(完)

整理自唐杰微博长文及 Andrej Karpathy 2025 LLM 年度回顾

需要专业的网站建设服务?

联系我们获取免费的网站建设咨询和方案报价,让我们帮助您实现业务目标

立即咨询