山南市网站建设_网站建设公司_后端工程师_seo优化-果洛藏族自治州网站建设公司

进入 2026 年，他对 LLM 辅助编程的理解已经非常清晰：它不是“自动驾驶”，而是一位能力极强、但需要被正确引导的结对程序员。Andy系统性复盘了自己在走向 2026 的过程中，如何把 AI 真正纳入日常工程体系——从前期规划，到代码生成，再到团队协作，几乎覆盖了一整套可复用的实战方法论。

2025年，AI 编程助手真正成为了改变游戏规则的工具。

不少开发者已经拥抱了AI编程工具，比如大家熟知的Claude Code、Codex CLI、Cursor、Gemini CLI等等。但要真正高效驾驭它们，还需要技巧和结构化的方法。

前几天，谷歌工程负责人、Chrome DevTools 和 JS Patterns 的设计者 Addy Osmani 结合自己一年多的项目实践经验，总结了一套AI Coding 的工作流。

进入 2026 年，他对 LLM 辅助编程的理解已经非常清晰：它不是“自动驾驶”，而是一位能力极强、但需要被正确引导的结对程序员。

Andy系统性复盘了自己在走向 2026 的过程中，如何把 AI 真正纳入日常工程体系——从前期规划，到代码生成，再到团队协作，几乎覆盖了一整套可复用的实战方法论。

在他的实践中，AI 并不是“写代码的黑箱”，而是被当作工程流程中的一环来精细管理。具体来说，这套方法包括：
在任何代码生成之前，先与 AI 一起打磨一份足够具体、可执行的项目方案，把需求、边界和目标一次性说清楚；
在 prompt 中大量使用明确的注释、约束和规则，主动限定 AI 的行为，而不是被动接收结果；
针对不同任务选择不同模型，而不是迷信“一个模型包打天下”；
保持高频、小步的代码提交，避免一次性生成或修改过多代码，导致项目状态失控；
为每一个新功能单独创建 worktree，将实验性改动与主线代码严格隔离；
通过规则文件约束 AI 的代码风格、目录结构和工程习惯，让生成代码更像“团队成员”而不是“临时外包”。
他的核心结论是：经典的软件工程纪律，不但没有过时，在 AI 时代反而更重要！

他的核心结论是：经典的软件工程纪律，不但没有过时，在 AI 时代反而更重要！

先设计、再编码；写测试；用版本控制；守住标准。当 AI 参与写一半代码时，这些原则的价值被进一步放大。

此外，Andy还分享了一个有趣的观点。很多人可能认为，AI Coding会加速程序员失业，取代程序员的岗位，但Andy认为，用好AI才能加速你的成长。

在审 AI 的代码、纠 AI 的 bug、让 AI 解释思路的过程中，其实能够学到大量新知识；而对于有扎实基本功的人来说，AI能让生产力成倍放大。

Andy表示，2026 年他将全面拥抱 AI，但方式是审慎、由专家主导的。这是一种更加自律的“AI 辅助工程”方法：在激进地利用 AI 能力的同时，依然对最终产出的软件负全部责任。

以下是他的干货分享，enjoy！

从清晰的计划开始：先写方案，再写代码

不要只是把“愿望”一股脑丢给 LLM，应先定义问题，再规划解决方案。

一个非常常见的错误，是在提示语还很模糊的情况下，直接让 AI 生成代码。在我的工作流中（以及许多成熟实践中），第一步并不是写代码，而是和 AI 一起头脑风暴，产出一份详细的规格说明，然后再整理出清晰的分步计划。

对于一个新项目，我通常会先描述整体想法，并让 LLM 不断向我反问，直到需求、边界条件和潜在的边缘情况都被充分挖掘出来。最终，我们会把这些内容整理成一份完整的spec.md，其中包含：功能需求、架构决策、数据模型，甚至测试策略。这份规格文档会成为整个开发过程的基石。

接下来，我会把这份 spec 交给一个具备推理能力的模型，让它生成项目计划：把实现过程拆解成逻辑清晰、粒度合适的小任务或里程碑。某种意义上，这是一个“迷你版设计文档 / 项目计划”。我通常会多次迭代这份计划——亲自修改，再让 AI 批判性地审视、优化——直到它足够完整、连贯，然后才进入真正的编码阶段。

这种前期投入乍看之下有点慢，但回报极高。正如 Les Orchard 所说，这就像是“15 分钟完成一次瀑布式设计”，一个快速而结构化的规划阶段，让后续编码变得异常顺畅。

有了清晰的规格和计划，当我们真正“释放”代码生成能力时，人和 AI 都非常清楚：我们要做什么，以及为什么要这么做。简而言之，先规划能让你和 AI 站在同一页上，避免无效反复。很多人会跳过这一步，但如今有经验的 LLM 开发者，已经把高质量的 spec / plan 当成整个工作流的核心。

把工作拆分成小而可迭代的块

范围管理是一切的关键：给 LLM 可控的小任务，而不是一次性塞进整个代码库。

我学到的一个重要教训是：不要让 AI 一次性输出大量、整体性的代码。相反，应把项目拆成一系列小步骤或“工单”，逐个完成。这本来就是良好的软件工程实践，但在引入 AI 之后变得尤为重要。

LLM 在聚焦型任务上表现最好：实现一个函数、修复一个 bug、添加一个小功能。比如在完成规划后，我会直接对代码生成模型说：“好，我们来实现计划里的第 1 步。”完成后测试，再进入第 2 步，如此循环。每一个 chunk 都足够小，小到 AI 能在上下文中处理干净，而你也能真正理解它生成的代码。

这种方式能有效防止模型“跑偏”。如果一次性要求太多，模型往往会迷失方向，生成一堆“纠缠在一起的代码垃圾”，非常难以维护。很多开发者都有类似体验：让 LLM 一口气生成一个完整应用，结果代码风格不统一、逻辑重复，“就像 10 个程序员各干各的，彼此完全没沟通”。我自己也踩过这个坑，解决方法只有一个：停下来，退一步，把问题切小。

每一轮迭代，我们都在已有上下文的基础上，增量式地推进。这也非常适合测试驱动开发（TDD）：每一步都可以同步编写或生成测试（后面会详细讲）。

不少编码 Agent 工具已经显式支持这种“分块”工作流。例如，我有时会生成一个结构化的“prompt plan”文件，里面包含每个任务对应的一条提示语，让 Cursor 这类工具按顺序逐条执行。核心原则只有一个：避免大跃进。通过小步快跑，我们大幅降低灾难性错误的概率，也能更快纠偏。LLM 在快速、受限的任务上非常擅长，要顺势而为。

提供充足的上下文和明确的指导

LLM 的质量上限，取决于你提供的上下文质量。把相关代码、文档和约束条件都给它。

在处理真实代码库时，我会确保 AI 拥有完成任务所需的一切信息：相关源码、技术约束、已知坑点、推荐或禁止的方案。现代工具在这方面已经很强了：比如 Claude 的 Projects 模式可以直接导入整个 GitHub 仓库；Cursor、Copilot 会自动把当前打开的文件放进上下文。但我通常还会做得更多。

如果我怀疑模型缺乏某些关键信息，就会通过 MCP（比如 Context7），或干脆手动把重要模块、API 文档粘进对话里。资深 LLM 用户普遍强调这种“上下文打包（context packing）”的重要性，比如在编码前来一次完整的“信息倾倒”，包括：

高层目标与不变量
正确解法的示例
明确警告哪些方案不要用

如果任务本身比较棘手，我甚至会提前告诉 AI 哪些朴素解法性能不行，或者给它一个外部参考实现。如果使用的是冷门库或全新 API，我会直接贴官方文档或 README，避免它“蒙着眼睛飞”。

所有这些前置上下文，都会显著提升输出质量，因为模型不需要猜测，而是基于事实和约束进行生成。

现在也有不少工具能自动化上下文整理，比如 gitingest、repo2txt，它们可以把代码库的关键部分导出成一个文本文件，让 LLM 一次性读入。对于大型项目来说，这是救命工具。原则很简单：不要让 AI 在信息不完整的情况下工作。一个 bug 如果涉及四个模块，就把这四个模块都给它。当然要注意 token 限制，但如今前沿模型的上下文窗口已经非常大（几万 token），合理利用即可。我通常只选取与当前任务相关的代码，并明确告诉 AI 哪些内容可以忽略，以节省上下文空间。

我个人也很看好 Claude Skills 这个方向：它把原本脆弱、一次性的提示，封装成可复用的“技能”，把指令、脚本和领域知识模块化。当请求匹配某个 Skill 时，工具可以自动应用这些能力，效果远好于通用 prompt。这让我们从一次性交互，走向可复用、可沉淀的工程流程。

目前社区已经有不少 Skills 集合，我很喜欢的一个例子是 frontend-design skill，它能终结 LLM UI 里泛滥的“紫色设计风”。在官方工具全面支持之前，也已经有一些可行的变通方案。

最后，在 prompt 里用明确的注释和规则引导 AI。例如，我会在代码前加一句：“这是 X 的当前实现，我们需要扩展它来做 Y，但一定不要破坏 Z。”这种小提示非常有效。LLM 本质上是“字面主义者”，你给什么指令，它就照着执行。上下文越清晰，幻觉和跑偏就越少，生成的代码也越贴合项目实际。

为不同任务选择最合适的模型

并不是所有编码 LLM 都一样，要有意识地选工具，必要时中途换模型。

到 2025 年，我们已经拥有大量强大的代码模型。我的工作流中，一个重要环节就是：为不同任务选择最合适的模型或服务。有时候，我甚至会并行尝试两个模型，看看它们对同一问题的思路有何不同。

每个模型都有自己的“性格”。关键在于：如果一个模型卡住了或输出平庸，立刻换另一个。我经常把同一个 prompt 原封不动地复制到另一个服务里，结果往往立竿见影。这种“模型轮换”在遇到盲点时非常救命。

另外，尽量用最新、最强的版本。如果条件允许，优先使用最新的 Pro 级模型。是的，这通常意味着付费，但生产力提升往往物有所值。说到底，选一个“合拍”的 AI 结对程序员也很重要。我认识一些人偏爱某个模型，只是因为它的回应风格更顺眼，这完全合理。当你要和 AI 长时间对话时，体验和语气真的很重要。

就我个人而言，最近很多编码工作我会优先用 Gemini，因为交互更自然，第一次就理解需求的概率更高。但我从不犹豫在必要时切换模型；有时候，“第二意见”能让解法突然浮现。总结一句：为任务选对工具，并记住你手里有一整套 AI 工具箱可用。

在整个软件生命周期中使用 AI 编码能力

在 SDLC 的各个阶段引入 AI，让开发体验全面提速。

在命令行层面，新一代 AI Agent 已经出现：Claude Code、OpenAI Codex CLI、Google Gemini CLI，都可以直接在项目目录里对话，读取文件、运行测试，甚至多步修复问题。我也用过 Google 的 Jules、GitHub Copilot Agent——它们是异步的编码 Agent，会把你的仓库克隆到云端 VM，在后台完成任务（写测试、修 bug），然后直接给你一个 PR。第一次看到这种体验时真的很诡异：你只下了一条指令，比如“重构支付模块以支持 X”，过一会儿就收到一个测试通过的 Pull Request。我们确实活在未来。关于这一点，可以参考《From conductors to orchestrators》。

当然，这些工具并不完美，必须清楚它们的边界。它们非常擅长加速机械性工作，样板代码、重复性修改、自动跑测试，但仍然高度依赖你的引导。例如，当我让 Claude 或 Copilot Agent 实现某个功能时，通常会把前面整理好的计划或待办清单一起给它。如果工具支持，我会直接把spec.md或plan.md加进上下文，让它严格按步骤执行。

我们还远没到可以完全放手，让 AI 独立实现完整功能并期待完美结果的阶段。我的使用方式始终是“有人监督”：让 AI 生成、运行代码，但我随时盯着进度，一旦有异常就介入。也有一些编排工具（如 Conductor）支持并行运行多个 Agent，让不同 Agent 同时处理不同任务。本质上是在“规模化 AI 劳动力”。我也尝试过这种“多 Agent 并行”模式，效率惊人，但同时也非常耗费心智去监控。多数情况下，我还是选择一个主 Agent，再加一个辅助 Agent 做评审。

记住：这些都是电动工具。你仍然掌控扳机。

始终让人留在回路中：验证、测试、审查一切

AI 可以写出看起来很像真的代码，但质量责任始终在你。

我有一条铁律：永远不要盲信 LLM 的输出。正如 Simon Willison 所说，把 LLM 当成一个“自信过头、但容易犯错的结对程序员”。它会以 100% 的确信写出包含 bug 的代码，除非你指出来，否则它不会意识到问题。

因此，我把每一段 AI 生成的代码，都当成来自初级工程师的提交：逐行阅读、运行、测试。一定要测试。跑单测、手动验证功能是否符合预期。对此我强烈推荐阅读《Vibe coding 不是低质量的借口》。

事实上，我把测试直接嵌入工作流中。前期规划时就会包含测试清单或测试策略。如果使用 Claude Code 这类工具，我会明确指示它在完成任务后运行测试，并在失败时继续调试。只要测试存在，AI 在“写代码 → 跑测试 → 修 bug”的闭环里表现非常出色。这也是为什么最能榨干 coding agent 价值的人，往往也是测试做得最好的人。有完善测试套件的项目，对 AI 来说就像装了安全网；没有测试，Agent 很容易在“看起来一切正常”的幻觉中破坏多个模块。

除了自动化测试，代码审查同样不可少——包括人工和 AI 辅助审查。我经常会暂停下来，逐行审查当前生成的代码，甚至开一个第二个 AI 会话（或换一个模型）来做 review。例如让 Claude 写代码，再让 Gemini 审一遍：“你能检查这个函数有没有潜在问题吗？”这种方式经常能抓住一些微妙 bug。AI 写的代码，反而更需要审查，因为它往往“表面上很合理”。

我还会使用 Chrome DevTools MCP（这是我和上一个团队一起做的）来增强调试和质量闭环。它相当于“给 AI 装上眼睛”，让 Agent 能看到浏览器实际状态：DOM、性能追踪、控制台日志、网络请求。这极大减少了上下文切换的摩擦，使 LLM 能基于真实运行数据进行 UI 测试和精确修复。

忽视人类监督的代价已经有人替我们踩过。曾有开发者在赶项目时大量依赖 AI 生成，结果代码结构混乱、逻辑重复、命名不一致。他后来意识到自己一直在“往前堆代码”，却从没停下来整体审视。最终只能痛苦重构，并发誓再也不让事情失控。我把这个教训牢记在心：无论 AI 用得多狠，我始终是最终负责的工程师。

在实践中，这意味着：只有在我真正理解代码之后，才会合并或上线。如果 AI 生成的代码过于复杂，我会让它加注释解释，或者干脆重写成更清晰的版本。只要感觉不对劲，就深入挖——就像对待任何人类同事的可疑提交一样。

归根结底是心态问题：LLM 是助手，而不是可靠的自主程序员。我是高级工程师，AI 是加速器，而不是判断替代品。这种立场不仅带来更好的代码，也能保护你作为开发者的长期成长。只要你始终参与其中、主动理解和审查，你不是在退化，而是在更高速度下锻炼判断力。

一句话总结：保持警惕，频繁测试，永远审查。代码库最终仍然是你的。

频繁提交，把版本控制当作安全网

永远不要提交你解释不清楚的代码。

在 AI 能快速生成大量代码的情况下，事情很容易失控。我的应对方式是：极端细粒度的版本控制习惯。我提交得比纯手写代码时代还要频繁。每完成一个小任务或一次成功的自动修改，就立刻提交一次，提交信息写清楚。

这样一来，如果 AI 的下一步引入了 bug 或糟糕改动，我可以迅速回滚到最近的稳定点，或者 cherry-pick，而不是损失几个小时的工作。有人把这种做法比喻为“游戏里的存档点”，我非常认同。有了这种安全感，你才敢大胆尝试 AI 的激进重构。

版本控制还能弥补 AI 的“记忆缺陷”。我经常翻看最近的提交记录，来给 AI（或者自己）复盘发生了什么。甚至可以直接把 git diff 或 commit log 粘给 AI，它们非常擅长理解 diff，用git bisect找 bug 也毫无怨言——前提是你的提交历史足够干净。

另一个好处是：小提交 + 清晰信息，本身就是文档。无论是人类还是 AI 做 code review，都更容易定位问题。如果所有改动都塞在一个叫“AI changes”的巨大提交里，基本等于灾难。所以我强迫自己遵守纪律：完成任务 → 跑测试 → 提交。

我还会大量使用分支或 git worktree 来隔离 AI 实验。一个我很喜欢的高级技巧（受 Jesse Vincent 启发）是：为每个新功能或子任务创建一个独立 worktree。这样可以在同一个仓库里并行跑多个 AI 会话，互不干扰。失败了直接丢弃，成功了再合并。版本控制正是让这种 AI 协作成为可能的基础设施。

总结一句：多提交、用好分支、把 git 当成 AI 时代的控制系统。

用规则和示例定制 AI 的行为

通过风格指南、示例，甚至“规则文件”来引导 AI，前期一点调校，能换来长期高质量输出。

我学到的一点是：你完全不必接受 AI 的默认风格。你可以强力引导它。我自己维护了一个CLAUDE.md文件（用 Gemini CLI 时也有GEMINI.md），里面写的是流程规则和偏好，比如：

遵循项目代码风格
通过 lint 规则
禁用某些函数
偏好函数式而非 OOP

每次会话开始时把这个文件喂给模型，效果非常好，能显著减少“跑偏”。这就像 Jesse Vincent 说的：它能让模型始终沿着既定轨道前进。

即使不用规则文件，你也可以通过自定义指令或 system prompt 达到类似效果。Copilot、Cursor 都支持项目级别的行为配置。我通常会写一小段说明，比如缩进规范、React 中避免箭头函数、变量命名要求、必须通过 ESLint 等。设置好之后，AI 的输出就更像一个真正融入团队的工程师。Ben Congdon 曾感慨，很少有人使用 Copilot 的自定义指令，但效果却出奇地好——我完全赞同。

另一个非常有效的技巧是：给示例。如果我希望 AI 以某种方式写函数，就先给它看一个现有实现；如果想要特定的注释风格，就先自己写一段示例。LLM 非常擅长模仿，一两个例子就够了。

社区里还有不少“规则集”来约束模型行为，比如明确写上“如果不确定，请提问而不是编造答案”。我自己经常加一条：“修 bug 时请在注释中简要说明原因。”这样后续 review 非常省心。

总结来说：不要把 AI 当黑箱。像 onboarding 新同事一样给它规则、示例和期望。投入产出比极高。

把测试和自动化当作放大器

CI/CD、lint、代码审查机器人，会让 AI 发挥最大价值。

这是前面原则的自然延伸：强自动化的工程环境，会极大放大 AI 的生产力。我确保所有大量使用 AI 的仓库，都有完善的 CI：自动测试、代码风格检查、最好还有 staging 部署。

这样一来，AI 打开 PR 后，CI 失败的日志就能直接喂回给 AI：“集成测试失败，错误是 XYZ。”问题修复立刻变成一个高速反馈回路，AI 非常擅长这种模式。

我甚至会把 linter 的报错直接贴进 prompt，让 AI 修复。只要它“看到”工具反馈，就会非常努力地纠正。这也是为什么一些 Agent 会在测试全绿之前拒绝宣称“完成任务”——这正是你希望看到的行为。

当 AI + 自动化形成闭环时，你会感觉像是：一个极快的初级工程师，配上一个永不疲倦的 QA。前提是，你得先把环境搭好。没有测试和自动检查，AI 的问题往往会被拖到很后面才暴露。

展望 2026，我计划进一步强化 AI 代码贡献的质量闸门：更多测试、更多监控，甚至 AI 审 AI。听起来有点悖论，但确实有效。底线很简单：AI 友好的工作流，一定是自动化成熟的工作流。

用好AI，能加速你的成长

把每次 AI 编码当作学习机会，形成正反馈循环。

使用 LLM 的一个意外收获是：我学得更多了，而不是更少。AI 让我接触到新的语言、框架和技巧，否则我未必会主动尝试。

一个普遍规律是：AI 会奖励良好的工程基础。有扎实基本功的人，生产力被成倍放大；基础薄弱的人，困惑也会被放大。LLM 让你能站在更高抽象层上思考（设计、接口、架构），但前提是你本来就具备这些能力。正如 Simon Willison 所说：几乎所有“高级工程师”的核心能力，正是如今用好 AI 的关键。

对于担心 AI 会让人“退化”的声音，我的看法相反：只要你始终参与审查和理解，AI 反而会加速成长。通过审 AI 的代码、纠 AI 的 bug、让 AI 解释思路，我学到了大量新知识。AI 也成了我随叫随到的研究助理，帮我比较方案、分析权衡。

宏观来看，AI 放大的是你的专业能力。进入 2026 年，我并不担心它“抢工作”，而是期待它把我从体力活中解放出来。当然，前提是要有扎实基础，否则 AI 可能会制造“邓宁-克鲁格效应加强版”。

一句建议：持续打磨基本功，用 AI 加速这个过程。开发者 + AI 的组合，远比任何一方单独强大。

结语：2026年全面拥抱AI编程

进入 2026 年，我已经全面拥抱 AI，但方式是审慎、由专家主导的。这是一种“AI 增强的软件工程”，而不是“AI 自动化的软件工程”。

我的核心结论是：经典的软件工程纪律，不但没有过时，在 AI 时代反而更重要。先设计、再编码；写测试；用版本控制；守住标准——当 AI 参与写一半代码时，这些原则的价值被进一步放大。

未来一定会继续演进。也许会有更自主的“AI 实习生”，也许会出现全新的调试和代码探索范式。但无论如何，我都会始终留在回路中，引导 AI、向它学习、并负责任地放大自己的生产力。

对我来说，最终结论只有一句：AI 编程助手是强大的杠杆，但人类工程师仍然是导演。

那么，祝你在 2026 年，构建愉快。

这位作者还有一期关于如何转向AI原生软件工程的公开演讲，感兴趣的朋友们可以去看看：
https://www.youtube.com/watch?v=FoXHScf1mjA

如果你想更深入地学习大模型，以下是一些非常有价值的学习资源，这些资源将帮助你从不同角度学习大模型，提升你的实践能力。

一、全套AGI大模型学习路线

AI大模型时代的学习之旅：从基础到前沿，掌握人工智能的核心技能！

因篇幅有限，仅展示部分资料，需要点击文章最下方名片即可前往获取

二、640套AI大模型报告合集

这套包含640份报告的合集，涵盖了AI大模型的理论研究、技术实现、行业应用等多个方面。无论您是科研人员、工程师，还是对AI大模型感兴趣的爱好者，这套报告合集都将为您提供宝贵的信息和启示

因篇幅有限，仅展示部分资料，需要点击文章最下方名片即可前往获取

三、AI大模型经典PDF籍

随着人工智能技术的飞速发展，AI大模型已经成为了当今科技领域的一大热点。这些大型预训练模型，如GPT-3、BERT、XLNet等，以其强大的语言理解和生成能力，正在改变我们对人工智能的认识。那以下这些PDF籍就是非常不错的学习资源。

因篇幅有限，仅展示部分资料，需要点击文章最下方名片即可前往获取

四、AI大模型商业化落地方案

作为普通人，入局大模型时代需要持续学习和实践，不断提高自己的技能和认知水平，同时也需要有责任感和伦理意识，为人工智能的健康发展贡献力量

山南市网站建设_网站建设公司_后端工程师_seo优化

从清晰的计划开始：先写方案，再写代码

把工作拆分成小而可迭代的块

提供充足的上下文和明确的指导

为不同任务选择最合适的模型

在整个软件生命周期中使用 AI 编码能力

始终让人留在回路中：验证、测试、审查一切

频繁提交，把版本控制当作安全网

用规则和示例定制 AI 的行为

把测试和自动化当作放大器

用好AI，能加速你的成长

结语：2026年全面拥抱AI编程

热门文章

文章分类

标签云

需要专业的网站建设服务？

山南市网站建设_网站建设公司_后端工程师_seo优化

从清晰的计划开始：先写方案，再写代码

把工作拆分成小而可迭代的块

提供充足的上下文和明确的指导

为不同任务选择最合适的模型

在整个软件生命周期中使用 AI 编码能力

始终让人留在回路中：验证、测试、审查一切

频繁提交，把版本控制当作安全网

用规则和示例定制 AI 的行为

把测试和自动化当作放大器

用好AI，能加速你的成长

结语：2026年全面拥抱AI编程

热门文章

文章分类

标签云

相关文章

VIENNA整流器仿真模型：零序注入SVPWM调制与中点电位平衡探秘

音乐格式解放：NCM加密音频一键转换全攻略

终极指南：3分钟学会NCM音频文件快速解密

需要专业的网站建设服务？