长久以来,代码世界的大门似乎只对少数掌握秘术的人敞开。我们被告知:你必须先理解内存、掌握语法、忍受枯燥的文档,才配谈论创造。
现在,随着大模型的发展,编程不再是一场苦修,而是一场大型即时策略游戏。在这个游戏里,很多人学会了与 AI 并肩作战,学会了用一种更纯粹、更直抵本质的方式去构建自己想要的世界。
Ben Tossell(Factory 开发者关系主管)就是其中一员。他是一位不怎么会写代码的人,在过去四个月里,却消耗了 30 亿个 Token。
这意味着每一分、每一秒,他都在通过终端窗口,观察 AI Agent 写下那些他凭一己之力永远无法写出的复杂代码。
或许有人会将这种方式贬低为所谓的氛围编程(Vibe-coding),但在 Tossell 看来,这个词带有某种傲慢的偏见。它像极了 2019 年人们对无代码(No-code)的刻板印象 —— 而正是那一年,他创办了自己的无代码教育公司并最终被 Zapier 收购。这种偏见选择性地忽视了隐藏在交互与调度背后的核心技能。
在 Tossell 看来,编程新范式下,衡量一个人的技术能力不再是看他能否默写语法,而是看他能否驾驭系统。
从无代码时代的先行者,到如今 30 亿 Token 的调度者,Ben Tossell 证明了一件事:在 AI 时代,通向代码世界的最高通行证不是专业背景,而是那种为了探索而探索的欲望。
为了记录这些体验,Tossell 还专门写了一篇文章,其在 X 上的浏览量已经超过了 360 万。接下来我们看看文章内容。
实际交付的产品
虽然烧掉了 30 亿 Token,但 Tossell 表示自己也是收获满满,包括:
- 个人网站:Tossell 重新设计了个人网站,使其看起来像一个终端 CLI 工具。
- Feed:Tossell 构建了一个简单的社交媒体追踪器,跟踪 subreddit 帖子和 GitHub 问题。它是开源的,得到了 100 多个 stars,很多人也克隆了这个项目。
- Factory Wrapped:Tossell 构建了 Factory 产品的第一个版本,展示给团队后他们非常喜欢,并决定将其融入到实际产品中,现在已经上线。Tossell 还添加了新的指南,重新整理了一些内容。虽然这看起来不像传统的编码,但对 Tossell 来说,它依旧是编码,整个过程没有变。
- 定制 CLI 工具:创建了一些 CLI 工具,例如 Pylon CLI,团队用它来帮助处理客户支持请求。
- 加密追踪器:Tossell 投资了一家能够准确预测金融、天气、健身和蛋白质折叠等动态数据中正面、负面或中性信号的公司。Tossell 基于这些预测构建了一个加密追踪器,能够自动根据预测开设和关闭多空仓位,类似一个迷你对冲基金。
- Droidmas:这是一个 12 天的实验或游戏,围绕 X 上人们讨论的不同主题展开,记忆、上下文管理、vibe coding 等。
- AI 指导的视频演示系统:简单来说,给它一个提示,它会创建一个视频。该系统作为自己的导演、制片人和编辑,能实时观看录制过程,并根据情况做出反应。如果遇到问题、bug,或者需要等待响应,它会处理。Tossell 用这个系统制作了一段视频,并由 OpenAI 发布。
此外,Tossell 还做了大约 50 个其他项目,其中有些已经被遗弃。
完全使用 CLI 来工作
Tossell 的战场不在花哨的网页界面,而是在纯粹的 CLI(命令行界面)。他认为终端胜过网页界面,并且还能看到它的工作过程。
每当 Tossell 有一个新的想法,或者遇到一个问题,Tossell 就会在 Droid(Factory 的 CLI)中启动一个新项目。他会与模型交流几次,提供上下文,然后切换到规范(spec)模式,制定构建计划。
在规范模式下,Tossell 会提出很多问题,比如他不理解这个是什么,为什么需要这个而不是那个,难道不能这样做吗?等等。
接着,在运行时,Tossell 让 Opus 4.5 在高自主性模式下运行,查看发生了什么,并在遇到错误时介入,最后进行测试,提供反馈并迭代。
agents.md 设置
Tossell 花了很多时间来思考如何设置最佳的 agents.md,因为这基本上就是操作手册。
Tossell 本地有一个 repos 文件夹,所有的编码项目都放在那里。在这个文件夹中,有一个 agents.md 文件,里面明确规定了每个新仓库的设置流程,做什么、不做什么,如何使用 GitHub、如何提交代码之类的内容,还会标明是否使用工作 GitHub 账户或个人 GitHub 账户。
端到端测试是 Tossell 以前没有特别关注的事情,但现在他非常希望在每个项目中都进行端到端测试。
基于他目前的知识和能力,很多时候在构建和测试过程中,总会有一些本应该早早发现的低级 bug,如果一开始就做了测试,可能就能避免这些问题。
Tossell 表示,他也经常查看他人的 agents.md 文件,看看有哪些可以借鉴的地方。Tossell 一直在努力改进自己的文档,从而让每次新的工作会话更加顺畅。
Tossell 学到了什么
Tossell 主要通过 CLI 而非 MCP 进行工作,不过他曾经使用过 MCP,但现在更倾向于使用 CLI 版本,因为它简单且更高效。比如在 Supabase、Vercel 和 GitHub 上,Tossell 总是使用 CLI 而非 MCP。
他还经常为自己的需求创建 CLI 工具。比如,他构建了自己的 Linear CLI,这样就能通过终端查询问题并执行任务,而不需要进入桌面或网页界面。
Bash 命令:Tossell 在处理变更日志的过程中真正理解了 Bash 命令的工作原理。这是一个重复的过程,最终理解了工作流程。Tossell 让 Droid 创建了一个斜杠命令流程,这是 Tossell 第一次正确使用的命令,它运行多个 Bash 命令,并提示模型做一些特定的任务,比如查看 GitHub 差异、检查功能标志的状态,或者将新功能和 bug 修复放到正确的部分。
VPS:Tossell 之前对 VPS 有一个抽象的理解,知道它是一个 24 小时运行的远程计算机。直到 Tossell 真正需要使用 VPS 时,Tossell 才深入了解它的用途。现在,Tossell 使用 VPS 来运行加密追踪器,获取每分钟的数据,同时保持它始终在线。使用 Droid Telegram 机器人时,Tossell 也依赖 VPS,通过 SyncThing 同步本地的仓库到 VPS,这样 Tossell 的仓库总是保持最新状态,能够随时接着上次的状态继续工作。
新的可编程抽象层
在看到 Andrej Karpathy 的推文时,Tossell 深有感触 —— 现在有了一个新的可编程抽象层需要掌握。
在无代码时代,抽象层是像 Webflow、Zapier 和 Airtable 这样的拖拽工具,将它们拼接在一起,让它看起来像真实的软件(直到你遇到限制)。
但现在,我们不再认为自己必须从零开始学习编写代码才能做这些事情,实际上,需要学习的是如何与 AI 合作。如何给它提供合适的提示?如何确保它拥有正确的上下文?如何把各个部分结合起来以及如何随着时间推移不断优化系统等等。
为了更好的掌握 AI 编程技能,Tossell 还会阅读像 Peter Steinberger 这样的程序员的帖子。从他的帖子中,Tossell 看到了他系统的简洁性:他只是和模型互动,让模型做事。这一发现让 Tossell 感到非常有信心,也让 Tossell 明白自己不需要一个复杂的系统。
Tossell 表示,在 X 上,你会看到很多人不断优化,甚至可能是过度优化自己的系统。对于像 Tossell 这样的人来说,这有时会感到很有压力,但他也认为这正是这个系统的魅力所在:它是一个完全可定制的系统,你可以根据自己的需要,让它按照你希望的方式工作。你可以像 Kieran 一样创建一个计划模式,或者像 Peter 一样直接与模型对话。
不过,他有时也会遇到 bug 和问题,但他明白这些问题其实是用户知识的空白,而不是自己当前能力的局限。
Tossell 的任务是识别这些空白,找到它们,并思考:如何确保这种问题永远不会再发生?或者如何确保自己足够理解这部分系统,以便下次发生时能及时发现。
所以,我们需要做什么呢?其实你只需要问模型。模型知道你不知道的所有东西。你可以不断向它提问。它是你永远耐心的、在你肩膀上的专家程序员。 你可以在 agents.md 中写道:Tossell 不是程序员,你需要非常简单地解释给 Tossell 听。你可以根据自己的需求完全定制它
我们学习的方式改变了
以往,Tossell 尝试过很多次学习编程,每次都是输入这些字符,按下回车,看看是不是显示 hello world。但 Tossell 觉得这和今天的学习方式差别很大。
如果按照传统的方式来学习编程,想要达到现在能构建的程度,可能需要花费数月甚至数年的时间才能有信心自己写代码。
而现在,Tossell 是从理解代码构建项目的系统思维角度来学习的。Tossell 在经营无代码教育公司时,无意中学到了这一点。你依然要理解:Webflow 是前端,Zapier 是 API 路由和连接层,数据流动,而 Airtable 是数据库。所以 Tossell 之前学会了这些系统化的思维,今天可以帮助他理解这些组件。
有太多东西可以学习了,但也是没有任何软件是不可达成的。
学会提出那些「愚蠢」的问题
人们常会冒出一些看似笨拙的问题,那些资深程序员或许早已习以为常,不再追问。
比如:既然框架是为了简化人类的工作,而现在的 LLM 已经如此强大且智能,为什么我们不干脆抛弃沉重的框架,让它直接写出最纯粹、零依赖的代码?这样不是能大大减少 Bug 和维护成本吗?
后来 Tossell 逐渐意识到,这并非一个傻问题。框架的存在,不仅是工具,更是共识与生态。LLM 的智慧源于海量的训练数据,而这些数据大多根植于现有的成熟框架之中。
这就是 Tossell 构建认知的过程。以前,Tossell 总觉得自己是代码世界的门外汉,甚至觉得这个领域高不可攀;而现在,通过这些直抵本质的提问,Tossell 正一步步拆掉思维的围墙。他不再只是一个使用者,而是正真实地成为这个工程世界的一部分。
关于氛围编程
虽然现在氛围编程这个词很火,但 Tossell 总觉得它没能触及灵魂。我们所做的,远不止于凭感觉,而是在深度理解系统 —— 去拆解它的逻辑,去改进它的构造。作为新时代的技术阶层,我们究竟该如何定义自己?
Tossell 不想称自己为非技术人员,但 Tossell 也不想被框在程序员这个传统标签里。他更像是一个处在某种无名阶层中的探索者。如果说无代码曾是一种误读,那么 Vibe Coding 现在也正带着某种傲慢的偏见。
对 Tossell 来说,编程更像是一场真实存在的宏大游戏。
这种新范式迷人之处在于:每一个创意都能被即刻实践,每一个念头都能深入探索。它不需要从一开始就追求完美,因为在这个过程中,掌握系统真谛才是重要的。就像代码未必都要上传 GitHub,有时候,它们只是通往某个系统深处的路标。
我们不要再为了工具而去生产工具。就像看到别人的 React 抓取工具,Tossell 不再只是感叹,而是会问自己: 我能做一个属于自己的吗?它的原理是什么?这种为了探索而探索的自由,正是新技术赋予我们的最高权限。
以前,学会编程更像是一种重资产投入。Tossell 曾以为,如果我们费尽心力做出了一个想法的简陋原型,结果却无人问津,那我们一定会因为投入了太多情感和成本而无法放手。
但在无代码时代,Tossell 第一次尝到了快节奏的甜头:一两个小时,一个周末,快速成型。如果市场不买单,那就随它去吧。因为投入极低,所以放手极快。
而现在,AI 让这种反馈循环达到了光速。
我们正处于软件大爆炸的前夜。你会看到平庸的作品泛滥,但更会看到无数惊艳的项目井喷。那些资深的程序员正以前所未有的速度发布着令人赞叹的开源工具。这意味着,我们拥有了一个取之不尽的灵感库和零件厂,可以随时克隆、调整、重混。
比起从读写文件这种最底层的语法练起,这种以结果为导向的重组效率高得惊人。反馈是即时的,输出是持续的。你不需要在起跑线上纠结太久,你只需要不断地去尝试,去碰撞。
在这个范式下,每一个创意都不再是沉重的负担,而是可以随时抛出的探针。如果你想,你可以随时随地、随心所欲地去构建一切。
Tossell 坚信,每个渴望进入技术世界的人都能做到这一点。你不需要计算机学位,你只需要一份允许自己去玩的许可。把编程看作一场游戏:去注册一个 CLI 智能体,告诉它你想做一个 RSS 追踪器、健身应用或个人网站。然后,按下启动键。
在这个过程中,你会撞上无数 Bug,但这正是最精彩的部分。你不再被错误困扰,而是开始好奇:为什么会这样?你要知道,即便顶尖专家也难逃 Bug 的围攻,而你拥有 ChatGPT 或 Claude 这样的多维智囊团。你可以从不同模型中获取视角,在无数种方案中做出选择。
在工具的丛林里,准则只有一条:最快、最简、最远。
面对琳琅满目的工具,没必要陷入选择瘫痪。选定一个,深挖下去。如果觉得缺了什么,尝试自己去造。
Tossell 最后总结说:「这整件事对我而言,是一场巨大的、令人享受的学习实验。不断构建,不断向前失败,然后不断把新作品推向世界。」
如何学习大模型 AI ?
由于新岗位的生产效率,要优于被取代岗位的生产效率,所以实际上整个社会的生产效率是提升的。
但是具体到个人,只能说是:
“最先掌握AI的人,将会比较晚掌握AI的人有竞争优势”。
这句话,放在计算机、互联网、移动互联网的开局时期,都是一样的道理。
我在一线互联网企业工作十余年里,指导过不少同行后辈。帮助很多人得到了学习和成长。
我意识到有很多经验和知识值得分享给大家,也可以通过我们的能力和经验解答大家在人工智能学习中的很多困惑,所以在工作繁忙的情况下还是坚持各种整理和分享。但苦于知识传播途径有限,很多互联网行业朋友无法获得正确的资料得到学习提升,故此将并将重要的AI大模型资料包括AI大模型入门学习思维导图、精品AI大模型学习书籍手册、视频教程、实战学习等录播视频免费分享出来。
第一阶段(10天):初阶应用
该阶段让大家对大模型 AI有一个最前沿的认识,对大模型 AI 的理解超过 95% 的人,可以在相关讨论时发表高级、不跟风、又接地气的见解,别人只会和 AI 聊天,而你能调教 AI,并能用代码将大模型和业务衔接。
- 大模型 AI 能干什么?
- 大模型是怎样获得「智能」的?
- 用好 AI 的核心心法
- 大模型应用业务架构
- 大模型应用技术架构
- 代码示例:向 GPT-3.5 灌入新知识
- 提示工程的意义和核心思想
- Prompt 典型构成
- 指令调优方法论
- 思维链和思维树
- Prompt 攻击和防范
- …
第二阶段(30天):高阶应用
该阶段我们正式进入大模型 AI 进阶实战学习,学会构造私有知识库,扩展 AI 的能力。快速开发一个完整的基于 agent 对话机器人。掌握功能最强的大模型开发框架,抓住最新的技术进展,适合 Python 和 JavaScript 程序员。
- 为什么要做 RAG
- 搭建一个简单的 ChatPDF
- 检索的基础概念
- 什么是向量表示(Embeddings)
- 向量数据库与向量检索
- 基于向量检索的 RAG
- 搭建 RAG 系统的扩展知识
- 混合检索与 RAG-Fusion 简介
- 向量模型本地部署
- …
第三阶段(30天):模型训练
恭喜你,如果学到这里,你基本可以找到一份大模型 AI相关的工作,自己也能训练 GPT 了!通过微调,训练自己的垂直大模型,能独立训练开源多模态大模型,掌握更多技术方案。
到此为止,大概2个月的时间。你已经成为了一名“AI小子”。那么你还想往下探索吗?
- 为什么要做 RAG
- 什么是模型
- 什么是模型训练
- 求解器 & 损失函数简介
- 小实验2:手写一个简单的神经网络并训练它
- 什么是训练/预训练/微调/轻量化微调
- Transformer结构简介
- 轻量化微调
- 实验数据集的构建
- …
第四阶段(20天):商业闭环
对全球大模型从性能、吞吐量、成本等方面有一定的认知,可以在云端和本地等多种环境下部署大模型,找到适合自己的项目/创业方向,做一名被 AI 武装的产品经理。
- 硬件选型
- 带你了解全球大模型
- 使用国产大模型服务
- 搭建 OpenAI 代理
- 热身:基于阿里云 PAI 部署 Stable Diffusion
- 在本地计算机运行大模型
- 大模型的私有化部署
- 基于 vLLM 部署大模型
- 案例:如何优雅地在阿里云私有部署开源大模型
- 部署一套开源 LLM 项目
- 内容安全
- 互联网信息服务算法备案
- …
学习是一个过程,只要学习就会有挑战。天道酬勤,你越努力,就会成为越优秀的自己。
如果你能在15天内完成所有的任务,那你堪称天才。然而,如果你能完成 60-70% 的内容,你就已经开始具备成为一名大模型 AI 的正确特征了。