智能体提示工程(Agent Prompting)与传统提示工程的关键差异

张开发
2026/4/10 23:29:15 15 分钟阅读

分享文章

智能体提示工程(Agent Prompting)与传统提示工程的关键差异
智能体提示工程Agent Prompting与传统提示工程的关键差异1. 引入与连接从“单一提问到“构建自主对话机器人”的思维跃迁1.1 引人入胜的开场从“让GPT-4o帮你写邮件到让它帮你完成一个完整的项目周报流程想象一下2023年11月OpenAI DevDay之前你用GPT-4最常用的场景是什么大概率是**你写一封礼貌又专业的客户跟进邮件要求是写给昨天在TechCrunch Disrupt上聊了5分钟AI项目融资意向的某风投VP提到昨天聊到的我们SaaS产品的AI智能推荐功能附上昨天演示失败后答应整理修改后的PPT截图链接以及约下周三下午的Zoom会议这是一个非常典型的传统提示工程Traditional Prompting任务给一个明确、闭环、单次或短链交互的需求输出一个标准化的、可直接使用的内容/结果片段。你可能会用Chain-of-ThoughtCoT让它一步步思考邮件的逻辑用Few-Shot少样本学习给几个VP喜欢的“精简又不失温度”的邮件模板参考但不管怎么优化这个过程本质上是你作为“指挥家”——从输入到输出的每一步决策、每一个边界、每一个工具调用的可能性都由你提前设定好或者至少由你预判并给出指令GPT-4只是一个“超级高效的执行者”没有自主意识、没有长期记忆、不能自己规划、更不能自主选择工具、自主修正计划、自主完成整个流程中的“意外情况”。但2023年11月之后一切都变了。OpenAI发布了GPT-4 Turbo带Retrieval、带函数调用增强、带Custom Instructions自定义指令、带Assistants API哦不对更早一点其实更早的GitHub Copilot Chat在IDE里已经有一点点“智能体”的雏形了——但Assistants API把这个概念彻底推到了台前。现在你可以构建一个**“完整的AI项目助理智能体**了。你只需要给它发一条这样的提示你是我的专属AI项目助理负责我手上所有的SaaS项目日常管理与沟通。你有权限访问我的Notion数据库我的Notion API Key我已经配置好了、我的飞书日历、我的Figma评论区、我的GitHub Issues列表、我的AWS CloudWatch警报、我的财务报告Google Sheets。你今天的任务是先从Notion项目管理数据库里找出所有状态标记为“本周待完成收尾下周里程碑有延期风险”的SaaS“智能内容审核3.0”项目的子任务检查Figma评论区里产品经理对“AI内容审核3.0”界面修改的最后一条评论昨天晚上9点47分张经理留的是否已经同步到GitHub Issues并分配给前端开发小李从GitHub Issues里小李刚才提交的界面修改PR是否已经通过了Code Review昨天晚上11点23分前端组组长王工留的Code Review意见有没有被小李回复并修改如果没有提醒他下午15点半前回复并修改检查AWS CloudWatch里“智能内容审核3.0”测试环境昨天晚上到今天早上有没有新的错误日志如果有先自己尝试搜索GPT-4o Vision API文档里有没有对应的错误修复方案然后标记为“紧急需要后端技术问题附修复建议优先级High”的GitHub Issue并自动推送到后端开发小赵检查财务报告Google Sheets里“智能内容审核3.0”的测试预算是否还剩多少如果低于10%提醒财务小李哦刚才叫财务的李姐别搞混明天上午9点半和产品经理张经理一起开个小会最后把以上所有的检查结果、修正建议、自动完成的动作比如创建的GitHub Issues、发送的飞书提醒整理成一份完整、专业、带Notion链接、带GitHub链接、带飞书链接的项目周报草稿**保存到我的Notion数据库的“项目周报草稿”文件夹里然后发一封邮件给所有相关人员张经理、王工、小李、小赵、李姐附上周报链接约明天上午10点开项目周会这就是智能体提示工程Agent Prompting哦等等——这看起来好像只是把一堆传统提示工程的任务串起来了不完全不是你仔细想想——传统提示工程里你能做到的是“把这些步骤一条一条分开写提示然后一条一条执行遇到每一条执行完之后你要自己复制粘贴结果到下一条提示里遇到张经理留的评论是不是分配错了遇到小李的PR有没有修改遇到CloudWatch的错误日志看不懂遇到财务预算低于10%遇到周报的邮箱地址错了每一个“意外”每一个“需要决策的地方”都需要你亲自介入亲自判断亲自修改提示亲自复制粘贴**。但智能体提示工程里呢——你只需要给它一个“目标”而不是一堆“步骤”——它有自己的长期记忆Threaded Conversations Vector Store记得刚才你说的前端组组长叫王工财务叫李姐不是两个小李——它有自己的自主规划能力可以先从Step Back、Plan-and-Execute、Tree-of-Thoughts、甚至ReAct等框架而不是你给的硬步骤如果发现你的步骤里有问题——比如“先检查Notion数据库里的状态但张经理留的评论分配给了小张哦刚才的提示里说检查状态的时候子任务里有没有提到“评论同步”如果没有它会不会先问你要不要补充或者直接根据Notion数据库里的字段“待同步的Figma/PR/评论”自动检查——它有自己的工具调用能力**可以自主选择Notion API、Figma API、GitHub API、AWS CloudWatch API、Google Sheets API、飞书API、邮件API而不是你给它硬编码好的每一次只能用什么工具——它有自己的自主修正能力如果发现调用GitHub Issues失败了它会不会自动重试会不会检查API Key有没有配置错了会不会换一个参数如果换参数不行会不会给你发个提醒说“你的GitHub API Key好像有问题无法访问小李的PR请检查一下”——它有自己的目标对齐能力如果发现周报里的内容太多不够专业它会不会根据你的习惯——哦对了你在Assistants API的Custom Instructions里提前设置过“周报的风格要精简每个要点最多3句话附上对应的链接不要用太多的专业术语财务部分要给李姐用通俗的语言解释开发部分要给王工、小李、小赵用专业的语言解释”——自动调整风格。哦对了最重要的一点——**传统提示工程里你和GPT-4的交互是“单向的短链的无记忆的”或者是“有一点点短期记忆比如ChatGPT的上下文窗口2023年是8K后来GPT-4 Turbo是128K但还是短期的因为上下文窗口会满满了就会把最前面的内容丢了”但智能体提示工程里你和智能体的交互是“双向的长链的有结构化长期记忆的Threaded Conversations Vector Store可以把所有的项目文档、周报模板、API文档、你的工作习惯、你的Notion数据库里的所有历史记录都上传到Vector Store里不管你和智能体的每一次对话、每一次工具调用、每一次结果输出都会被保存到Threaded Conversations里不管你什么时候回来和它聊不管聊多少轮不管聊什么内容它都记得之前聊过的一切——哦当然你也可以选择性的上传额外的上下文到Vector Store里让它记得更多的“专属信息”。1.2 与读者已有知识建立连接你之前学的所有提示工程都是智能体提示工程的“积木块”哦对了别担心——你之前学的所有传统提示工程的技巧——比如Chain-of-ThoughtCoT、Few-Shot少样本学习、Zero-Shot零样本学习、Self-Consistency自洽性、Step Back Prompting回溯提示、Tree-of-ThoughtsToT思维树、Retrieval-Augmented GenerationRAG检索增强生成、Prompt Chaining提示链、Guardrails安全护栏、Instruction Tuning指令微调、Role Prompting角色提示——所有这些都是智能体提示工程的“积木块”你之前学的Chain-of-ThoughtCoT现在可以用来让智能体在做“自主规划”的时候一步步思考“为什么要先做这个步骤为什么要选这个工具为什么要问这个问题”你之前学的Few-Shot少样本学习现在可以用来给智能体在做“自主修正”的时候给几个“之前修正过的类似错误”的例子你之前学的Retrieval-Augmented GenerationRAG现在就是智能体提示工程里的“Vector Store”的核心技术你之前学的Prompt Chaining提示链现在就是智能体提示工程里的“自主规划”的雏形——但Prompt Chaining是你“硬编码”的提示链而智能体提示工程里的“自主规划”是智能体“动态生成”的提示链你可以把传统提示工程想象成“乐高基础套装里的说明书”——说明书告诉你“按照说明书你只能拼出一个特定的模型比如一个飞机说明书里写好了每一块积木放哪里怎么拼你可以把智能体提示工程想象成“乐高大师套装里的“想象力”——没有说明书只有一堆积木传统提示工程的所有技巧还有一个“**乐高大师机器人”智能体的核心——自主规划、长期记忆、工具调用、自主修正、目标对齐你只需要告诉它“我要拼一个能飞起来的、能载乐高小人的、能自动避开障碍物的、遥控飞机”——它就会自己思考“要拼一个能飞起来的遥控飞机需要什么积木需要哪些步骤需要先拼机身再拼机翼再拼起落架再拼遥控器不对要不要先看看Vector Store里的“乐高大师套装的说明书里的飞机模型要不要先拼能飞起来的飞机的基本原理要不要先问一下“你想要的遥控飞机是多大能载几个乐高小人避开什么样的障碍物用什么遥控器手机APP还是专门的乐高遥控器”——然后它就会自己拼拼错了会自己修正拼到机身不稳会自己调整机翼的角度拼到遥控器连不上手机APP会自己查Vector Store里的“乐高大师套装的手机APP连接指南会自己调整参数会自己尝试直到拼成功了会自己给你演示演示成功了会自己给你拼一个备用的起落架哦这个比喻是不是非常形象生动1.3 学习价值与应用场景预览为什么你现在学智能体提示工程能让你节省90%的重复工作消失现在你可能会问——**我为什么要学智能体提示工程传统提示工程不是已经很好用了吗哦对传统提示工程确实很好用——但它只能帮你做“单一、闭环、单次或短链交互”的任务比如写邮件、写代码片段、翻译、摘要、生成图片——但它不能帮你做“长链、开放、多工具、多决策、多意外”的任务比如做完整的项目周报流程、做完整的客户服务流程、做完整的内容创作流程、做完整的数据分析流程、做完整的市场营销流程、做完整的教育教学流程——这些流程里的90%的工作都是重复的、机械的、不需要你亲自介入的——而智能体提示工程就是用来帮你做这些重复的、机械的、不需要你亲自介入的工作的哦对了我给你算一笔账——假设你是一个互联网公司的产品经理你每周要花10个小时做项目周报流程、花5个小时做客户服务流程、花8个小时做内容创作流程、花7个小时做数据分析流程——总共每周要花30个小时做这些重复的、机械的、不需要你亲自介入的工作——如果你学了智能体提示工程你只需要花1个小时构建这些流程的智能体然后每周只需要花1个小时检查一下智能体的输出结果修改一下智能体的目标——总共每周只需要花2个小时——节省了28个小时——28个小时——你可以用这28个小时做什么——你可以用这28个小时做你真正想做的事情——比如和客户聊需求、和开发聊技术、和市场聊营销、和产品聊创新——这些事情才是真正能给公司创造价值的事情哦对了我再给你举几个具体的应用场景预览1.3.1 互联网公司产品经理的应用场景智能项目助理智能体负责项目周报流程、项目需求管理流程、项目风险预警流程、项目里程碑管理流程、项目预算管理流程、项目团队沟通流程——刚才已经举过例子了。1.3.2 互联网公司客服经理的应用场景智能客服主管智能体负责处理客户的简单问题比如FAQ、处理客户的中等问题比如订单查询、退款申请、物流查询、处理客户的复杂问题比如产品故障、产品投诉、整理客户的反馈、分析客户的反馈、生成客户反馈报告、优化FAQ、培训新的客服人员——比如智能客服主管智能体可以把简单的问题自动回复给客户把中等的问题自动分配给对应的客服人员把复杂的问题自动分配给对应的产品/技术/售后人员把客户的反馈自动整理成一份完整的报告自动分析客户的反馈自动找出最常见的问题自动优化FAQ自动生成新的客服人员的培训资料1.3.3 互联网公司内容运营的应用场景智能内容创作智能体负责选题策划从Notion数据库里的“选题库”里选从Google Trends、百度指数、微信指数里选从竞争对手的公众号、抖音、B站里选、内容大纲生成、内容初稿生成、内容修改根据你的习惯修改根据Vector Store里的“内容写作规范”修改根据SEO优化要求修改、内容排版、内容发布自动发布到公众号、抖音、B站、小红书、知乎等平台、内容数据分析自动分析阅读量、点赞量、评论量、转发量、收藏量、完读率、转化率、内容优化建议生成——比如智能内容创作智能体可以自动选10个选题你只需要选1个然后它就会自动生成内容大纲、内容初稿、内容修改、内容排版、内容发布、内容数据分析、内容优化建议1.3.4 互联网公司数据分析师的应用场景智能数据分析智能体负责数据采集自动采集Google Analytics、百度统计、腾讯云CDN、AWS S3、MySQL、PostgreSQL等平台的数据、数据清洗、数据存储、数据可视化自动生成柱状图、折线图、饼图、散点图、热力图等图表、数据分析自动进行描述性统计分析、推断性统计分析、机器学习分析、数据报告生成自动生成一份完整、专业、带图表、带链接、带结论、带建议的数据报告、数据预警自动设置数据异常的预警比如销售额突然下降10%或者用户留存率突然下降5%或者服务器负载突然上升80%——比如智能数据分析智能体可以自动采集数据、自动清洗数据、自动存储数据、自动可视化数据、自动分析数据、自动生成数据报告、自动设置数据预警1.3.5 互联网公司市场营销的应用场景智能市场营销智能体负责市场调研自动调研竞争对手的产品、价格、渠道、促销、目标客户画像生成、市场营销策略生成、市场营销计划生成、市场营销预算分配、市场营销活动策划、市场营销活动执行、市场营销活动数据分析、市场营销活动优化建议生成——比如智能市场营销智能体可以自动调研竞争对手的产品、价格、渠道、促销自动生成目标客户画像自动生成市场营销策略自动生成市场营销计划自动分配市场营销预算自动策划市场营销活动自动执行市场营销活动自动分析市场营销活动的数据自动生成市场营销活动的优化建议1.3.6 教育机构老师的应用场景智能教学助理智能体负责课程设计从Notion数据库里的“课程库”里选从教育部的课程标准里选从学生的学习情况里选、教案生成、课件生成、作业生成、作业批改、作业分析、学生学习情况分析、学生学习情况报告生成、个性化学习计划生成、个性化学习资源推荐、学生学习情况预警自动设置学生学习情况异常的预警比如学生的作业正确率突然下降10%或者学生的上课出勤率突然下降5%或者学生的考试成绩突然下降20%——比如智能教学助理智能体可以自动设计课程、自动生成教案、自动生成课件、自动生成作业、自动批改作业、自动分析作业、自动分析学生学习情况、自动生成学生学习情况报告、自动生成个性化学习计划、自动推荐个性化学习资源、自动设置学生学习情况预警哦这些应用场景是不是非常吸引人是不是你现在工作中遇到的所有痛点都可以用智能体提示工程解决1.4 学习路径概览从“积木块”到“乐高大师机器人”的搭建指南好了现在你已经知道了智能体提示工程是什么它和传统提示工程有什么不一样它有什么用——接下来我就给你一个完整的学习路径概览让你从“只会拼说明书里的模型的新手”变成“会拼任何你想要的模型的乐高大师”1.4.1 第一步复习传统提示工程的所有“积木块”第2章首先你需要复习传统提示工程的所有核心技巧——比如Chain-of-ThoughtCoT、Few-Shot少样本学习、Zero-Shot零样本学习、Self-Consistency自洽性、Step Back Prompting回溯提示、Tree-of-ThoughtsToT思维树、Retrieval-Augmented GenerationRAG检索增强生成、Prompt Chaining提示链、Guardrails安全护栏、Instruction Tuning指令微调、Role Prompting角色提示——哦如果你还没有学过这些技巧没关系第2章会给你一个非常详细、非常深入、非常易于理解的复习/学习指南包括每个技巧的核心概念、问题背景、问题描述、问题解决、边界与外延、概念结构与核心要素组成、数学模型、算法流程图、Python源代码、实际场景应用、最佳实践tips、行业发展与未来趋势1.4.2 第二步理解智能体的核心概念与架构第3章其次你需要理解智能体的核心概念与架构——比如什么是智能体Agent什么是智能体的感知Perception模块什么是智能体的规划Planning模块什么是智能体的行动Action模块什么是智能体的记忆Memory模块什么是智能体的学习Learning模块什么是智能体的对齐Alignment模块什么是智能体的评价Evaluation模块什么是智能体的工具Tools什么是智能体的环境Environment什么是智能体的循环Loop什么是经典的智能体架构——比如Simple Reflex Agent简单反射智能体、Model-Based Reflex Agent基于模型的反射智能体、Goal-Based Agent基于目标的智能体、Utility-Based Agent基于效用的智能体、Learning Agent学习型智能体什么是现代的大语言模型LLM驱动的智能体架构——比如ReAct、Plan-and-Execute、AutoGPT、BabyAGI、GPT-4o Assistants API、LangChain Agents、AutoGen1.4.3 第三步对比智能体提示工程与传统提示工程的关键差异第4章再次你需要对比智能体提示工程与传统提示工程的关键差异——这也是这篇文章的核心章节哦不对刚才的引入是第1章复习传统提示工程是第2章理解智能体的核心概念与架构是第3章对比关键差异是第4章——第4章会从至少10个核心维度对比智能体提示工程与传统提示工程的关键差异包括交互模式、目标输入、输出结果、记忆能力、规划能力、工具调用能力、自主修正能力、目标对齐能力、安全防护能力、开发与部署难度、应用场景、性能与效率、成本与收益、未来发展趋势——每个维度都会有核心概念、问题背景、问题描述、问题解决、边界与外延、概念结构与核心要素组成、概念之间的关系ER实体关系图、交互关系图、数学模型、算法流程图、Python源代码、实际场景应用、项目介绍、环境安装、系统功能设计、系统架构设计、系统接口设计、系统核心实现源代码、最佳实践tips、行业发展与未来趋势——哦不对第4章是对比关键差异所以每个维度都会有核心属性维度对比的Markdown表格**还有ER实体关系图还有交互关系图还有实际场景对比的例子1.4.4 第四步学习如何构建一个完整的智能体第5章然后你需要学习如何构建一个完整的智能体——比如用GPT-4o Assistants API、LangChain Agents、AutoGen——第5章会给你一个非常详细、非常深入、非常易于理解的实战指南包括项目介绍、环境安装、系统功能设计、系统架构设计、系统接口设计、系统核心实现源代码、最佳实践tips、常见问题与解决方案1.4.5 第五步学习如何优化智能体的性能第6章接着你需要学习如何优化智能体的性能——比如如何优化智能体的规划能力、如何优化智能体的记忆能力、如何优化智能体的工具调用能力、如何优化智能体的自主修正能力、如何优化智能体的目标对齐能力、如何优化智能体的安全防护能力、如何优化智能体的响应速度、如何优化智能体的成本——第6章会给你一个非常详细、非常深入、非常易于理解的优化指南包括每个优化方向的核心概念、问题背景、问题描述、问题解决、边界与外延、概念结构与核心要素组成、数学模型、算法流程图、Python源代码、实际场景应用、最佳实践tips、行业发展与未来趋势1.4.6 第六步学习如何评价智能体的性能第7章最后你需要学习如何评价智能体的性能——比如如何评价智能体的规划准确性、如何评价智能体的行动准确性、如何评价智能体的自主修正能力、如何评价智能体的目标对齐能力、如何评价智能体的安全防护能力、如何评价智能体的响应速度、如何评价智能体的成本与收益——第7章会给你一个非常详细、非常深入、非常易于理解的评价指南包括每个评价维度的核心概念、问题背景、问题描述、问题解决、边界与外延、概念结构与核心要素组成、数学模型、算法流程图、Python源代码、实际场景应用、最佳实践tips、行业发展与未来趋势1.4.7 第七步整合提升从“乐高大师”到“知识架构师”第8章最后的最后你需要整合提升——从“只会拼模型的乐高大师”变成“会设计模型的知识架构师”——第8章会给你一个非常详细、非常深入、非常易于理解的整合提升指南包括核心观点回顾与强化、知识体系的重构与完善、思考问题与拓展任务、学习资源与进阶路径2. 概念地图建立智能体提示工程与传统提示工程的整体认知框架2.1 核心概念与关键术语首先我们需要先明确这篇文章中所有的核心概念与关键术语避免产生误解2.1.1 传统提示工程Traditional Prompting核心定义指给大语言模型LLM或多模态大语言模型MLLM提供一段明确、闭环、单次或短链交互的输入文本或多模态输入引导模型输出一个标准化的、可直接使用的内容/结果片段的过程。关键术语提示Prompt给大语言模型或多模态大语言模型提供的输入文本或多模态输入。上下文窗口Context Window大语言模型或多模态大语言模型在单次交互中能够处理的最大输入输出字符/Token的数量。Token大语言模型或多模态大语言模型处理文本的基本单位通常是一个单词、一个词组、一个字符的一部分比如中文通常是1-2个字符对应一个Token英文通常是1个单词对应1-3个Token。推理Inference大语言模型或多模态大语言模型根据提示生成输出的过程。生成Generation大语言模型或多模态大语言模型根据推理结果输出内容的过程。补全Completion早期大语言模型比如GPT-1、GPT-2、GPT-3的主要功能指根据提示补全文本的后续内容。对话Chat现代大语言模型比如GPT-3.5 Turbo、GPT-4、GPT-4o、Claude 3、Gemini 1.5的主要功能指根据用户的对话历史和当前的输入生成回复。2.1.2 智能体提示工程Agent Prompting核心定义指给大语言模型LLM或多模态大语言模型MLLM驱动的智能体提供一个开放、长链、多工具、多决策、多意外的目标或目标初始上下文引导智能体自主感知环境、自主规划行动、自主调用工具、自主执行行动、自主修正计划、自主对齐目标、自主完成整个流程的过程**。关键术语智能体Agent指能够在环境中自主感知、自主规划、自主行动、自主学习、自主对齐目标的实体。环境Environment指智能体所处的外部世界包括物理环境比如机器人所处的房间和数字环境比如互联网、Notion数据库、GitHub、Figma、飞书、邮件、Google Sheets、AWS CloudWatch等。感知Perception指智能体通过传感器比如摄像头、麦克风、API接口等获取环境信息的过程。规划Planning指智能体根据感知到的环境信息和目标生成一系列行动步骤的过程。行动Action指智能体根据规划好的行动步骤调用工具或直接影响环境的过程。记忆Memory指智能体存储感知到的环境信息、规划好的行动步骤、执行过的行动结果、学习到的知识的过程。学习Learning指智能体根据执行过的行动结果和反馈调整自己的感知、规划、行动、对齐策略的过程。对齐Alignment指智能体确保自己的行动步骤和执行结果符合用户的目标和价值观的过程。评价Evaluation指智能体或用户根据目标评价执行结果的好坏的过程。工具Tools指智能体可以调用的外部API接口或程序比如Notion API、Figma API、GitHub API、AWS CloudWatch API、Google Sheets API、飞书API、邮件API、计算器、搜索引擎、代码解释器等。循环Loop指智能体的感知-规划-行动-记忆-学习-对齐-评价的重复过程。思考-行动-观察循环Thought-Action-Observation Loop指现代大语言模型驱动的智能体的核心循环比如ReAct框架。向量存储Vector Store指智能体用来存储长期记忆的数据库比如OpenAI Assistants API的Vector Store、LangChain的ChromaDB、Pinecone、Weaviate等。线程Thread指智能体和用户之间的对话历史比如OpenAI Assistants API的Threaded Conversations。函数调用Function Calling指大语言模型或多模态大语言模型根据提示生成符合特定格式的函数调用请求然后由外部程序调用对应的函数并将函数的返回值返回给大语言模型或多模态大语言模型的过程。2.2 概念间的层次与关系接下来我们需要建立智能体提示工程与传统提示工程的概念间的层次与关系2.2.1 传统提示工程是智能体提示工程的子集不传统提示工程是智能体提示工程的“基础技术层哦对了刚才的引入里已经提到过——传统提示工程是智能体提示工程的“积木块”或者说“基础技术层”——智能体提示工程是在传统提示工程的基础上增加了感知模块、规划模块、行动模块、记忆模块、学习模块、对齐模块、评价模块、工具调用能力、循环机制**等内容从而实现了从“单一执行者”到“自主智能体”的思维跃迁。2.2.2 智能体提示工程与传统提示工程的概念层次结构我们可以用一个金字塔式的概念层次结构来展示智能体提示工程与传统提示工程的概念间的层次与关系[智能体提示工程顶层 ├─ 目标对齐模块 ├─ 评价模块 ├─ 学习模块 ├─ 循环机制 │ ├─ 思考-行动-观察循环ReAct │ ├─ 计划-执行-反思循环Plan-and-Execute │ └─ 其他循环机制 ├─ 规划模块 │ ├─ 自主规划能力 │ └─ 规划技术 │ ├─ 回溯提示Step Back │ ├─ 思维树ToT │ ├─ 提示链Prompt Chaining │ └─ 其他规划技术 ├─ 行动模块 │ ├─ 工具调用能力 │ └─ 工具调用技术 │ ├─ 函数调用Function Calling │ └─ 其他工具调用技术 ├─ 感知模块 │ ├─ 多模态感知能力 │ └─ 感知技术 │ ├─ 检索增强生成RAG │ └─ 其他感知技术 ├─ 记忆模块 │ ├─ 长期记忆能力 │ ├─ 短期记忆能力 │ └─ 记忆技术 │ ├─ 向量存储Vector Store │ ├─ 线程Thread │ └─ 其他记忆技术 └─ 传统提示工程基础技术层 ├─ 角色提示Role Prompting ├─ 指令提示Instruction Prompting ├─ 零样本学习Zero-Shot ├─ 少样本学习Few-Shot ├─ 思维链CoT ├─ 自洽性Self-Consistency ├─ 安全护栏Guardrails └─ 其他传统提示工程技巧2.3 学科定位与边界接下来我们需要明确智能体提示工程与传统提示工程的学科定位与边界2.3.1 学科定位传统提示工程属于自然语言处理NLP领域的应用子领域或者属于大语言模型LLM/多模态大语言模型MLLM领域的应用技术。智能体提示工程属于人工智能AI领域的综合应用子领域它融合了自然语言处理NLP、计算机视觉CV、多模态学习Multimodal Learning、智能体Agent、知识图谱Knowledge Graph、检索增强生成RAG、机器学习ML、强化学习RL、**软件工程SE**等多个学科的知识。2.3.2 学科边界传统提示工程的边界交互模式只能处理明确、闭环、单次或短链交互的任务。记忆能力只能处理**短期记忆上下文窗口内的对话历史**的任务。规划能力只能处理**硬编码的规划提示链**的任务。工具调用能力只能处理**硬编码的工具调用你明确告诉它调用什么工具什么时候调用工具怎么调用工具**的任务。自主修正能力没有自主修正能力如果你没有给它硬编码的修正规则它遇到意外情况就会出错。目标对齐能力只能处理明确、单一、短期的目标的任务。学习能力没有自主学习能力它只能通过提示学习或者通过指令微调学习但不能通过自主执行任务的结果和反馈学习。智能体提示工程的边界交互模式可以处理**开放、长链、多工具、多决策、多意外的目标或目标初始上下文**的任务。记忆能力可以处理**长期记忆向量存储线程**的任务。规划能力可以处理**动态生成的规划自主规划**的任务。工具调用能力可以处理自主选择工具、自主决定什么时候调用工具、自主决定怎么调用工具的任务。自主修正能力有自主修正能力它可以根据执行任务的结果和反馈自主调整自己的感知、规划、行动、对齐策略。目标对齐能力可以处理开放、复杂、长期的目标的任务。学习能力有自主学习能力它可以通过自主执行任务的结果和反馈自主调整自己的感知、规划、行动、对齐策略。3. 基础理解建立智能体提示工程与传统提示工程的直观认识3.1 传统提示工程的直观认识“给它指令它执行”3.1.1 核心概念的生活化解释传统提示工程就像你去餐厅吃饭给服务员一份明确、详细的菜单——比如“服务员给我来一份宫保鸡丁要微辣不要花生多放黄瓜丁米饭要一碗饮料要一杯冰可乐可乐要**少冰不要气太足谢谢”然后服务员拿到你的菜单提示然后厨师大语言模型根据你的菜单提示做出一份符合你要求的宫保鸡丁、一碗米饭、一杯少冰少气的冰可乐输出结果然后服务员大语言模型把这些东西端给你返回给你。哦对了服务员大语言模型会不会自己加花生会不会自己多放花生会不会自己少放黄瓜丁会不会自己给你多盛两碗米饭会不会自己给你一杯热橙汁——不会除非你给的菜单提示里没有说清楚或者你给的菜单提示里有歧义——比如你说“多放黄瓜”服务员大语言模型可能会给你放一根黄瓜条而不是多放黄瓜丁——这时候你就需要优化你的菜单提示让它更明确、更详细、更没有歧义——这就是传统提示工程的核心工作3.1.2 简化模型与类比我们可以用一个**“输入-处理-输出IPO简化模型**来展示传统提示工程的工作原理[用户输入提示明确、闭环、单次或短链交互] ↓ [大语言模型处理] ↓ [用户输出结果标准化、可直接使用的内容/结果片段]哦对了如果是短链交互的话这个简化模型可以稍微扩展一下[用户输入提示1明确、闭环] ↓ [大语言模型处理1] ↓ [用户输出结果1标准化、可直接使用的内容/结果片段] ↓ [用户复制粘贴输出结果1到提示2] ↓ [用户输入提示2明确、闭环] ↓ [大语言模型处理2] ↓ [用户输出结果2标准化、可直接使用的内容/结果片段] ↓ ... ↓ [用户复制粘贴输出结果n-1到提示n] ↓ [用户输入提示n明确、闭环] ↓ [大语言模型处理n] ↓ [用户输出结果n标准化、可直接使用的最终内容/结果片段]3.1.3 直观示例与案例接下来我们给大家举一个传统提示工程的直观示例与案例——比如写一封礼貌又专业的客户跟进邮件3.1.3.1 示例1零样本学习Zero-Shot提示不优化的提示首先我们给GPT-4o一个不优化的提示零样本学习提示“写一封客户跟进邮件。”然后GPT-4o的输出结果可能是这样的主题客户跟进 尊敬的客户 您好 感谢您对我们产品的关注 如果您有任何问题或需求请随时联系我们 祝您生活愉快 此致 敬礼 [您的姓名] [您的公司名称] [您的联系方式]哦这个输出结果太模糊、太通用、太不专业、太没有用了——这就是不优化的传统提示工程的输出结果3.1.3.2 示例2角色提示指令提示少样本学习Few-Shot提示优化后的提示接下来我们给GPT-4o一个优化后的提示角色提示指令提示少样本学习提示角色提示你是我的专属AI销售助理负责我手上所有的SaaS产品的客户跟进工作。你的目标是写出**礼貌、专业、简洁、有温度、有针对性、能促进销售转化的客户跟进邮件。指令提示请根据以下信息写一封客户跟进邮件收件人张总收件人公司ABC科技有限公司收件人职位风投VP聊天场景昨天在TechCrunch Disrupt上聊了5分钟AI项目融资意向SaaS产品智能内容审核3.0核心功能AI智能推荐功能昨天演示的昨天的问题演示失败了答应的事情整理修改后的PPT截图链接会议请求约下周三下午2点-4点的Zoom会议邮件风格精简每个要点最多2句话不要用太多的专业术语少样本学习Few-Shot示例1主题跟进TechCrunch Disrupt上的融资意向——智能客服机器人SaaS尊敬的李总您好昨天在TechCrunch Disrupt上和您聊了5分钟智能客服机器人SaaS的融资意向非常感谢您的时间昨天演示的时候网络有点卡答应给您整理的修改后的PPT截图链接已经准备好了https://example.com/ppt-screenshot-customer-service-bot请问您下周三下午2点-4点有没有时间我想和您再深入聊一下智能客服机器人SaaS的商业模式、市场规模、竞争优势等内容。期待您的回复祝您工作顺利此致敬礼王小明产品总监XYZ科技有限公司13800138000wangxiaomingxyztech.com示例2主题跟进TechCrunch Disrupt上的融资意向——智能数据分析SaaS尊敬的赵总您好昨天在TechCrunch Disrupt上和您聊了10分钟智能数据分析SaaS的融资意向非常感谢您的宝贵时间昨天演示的时候数据加载有点慢答应给您整理的修改后的PPT截图链接已经准备好了https://example.com/ppt-screenshot-data-analysis请问您下周四上午10点-12点有没有时间我想和您再深入聊一下智能数据分析SaaS的技术架构、核心算法、客户案例等内容。期待您的回复祝您工作顺利此致敬礼李小红产品总监XYZ科技有限公司13900139000lixiaohongxyztech.com然后GPT-4o的输出结果可能是这样的主题跟进TechCrunch Disrupt上的融资意向——智能内容审核3.0 尊敬的张总 您好 昨天在TechCrunch Disrupt上和您聊了5分钟智能内容审核3.0的融资意向非常感谢您的时间 昨天演示的时候AI智能推荐功能出了点小问题答应给您整理的修改后的PPT截图链接已经准备好了[https://example.com/ppt-screenshot-content-audit-3.0](https://example.com/ppt-screenshot-content-audit-3.0) 请问您下周三下午2点-4点有没有时间我想和您再深入聊一下智能内容审核3.0的商业模式、市场规模、竞争优势、技术架构等内容。 期待您的回复 祝您工作顺利 此致 敬礼 王小明 产品总监 XYZ科技有限公司 13800138000 wangxiaomingxyztech.com哦这个输出结果太完美了完全符合我们的要求——这就是优化后的传统提示工程的输出结果**3.1.4 常见误解澄清最后我们需要澄清几个传统提示工程的常见误解3.1.4.1 误解1提示越长越好错误提示不是越长越好而是越明确、越详细、越没有歧义、越符合大语言模型的理解方式越好——如果提示太长大语言模型可能会忘记最前面的内容上下文窗口的限制或者大语言模型可能会分心输出结果反而不好3.1.4.2 误解2提示

更多文章