本文解析AI智能体概念及ReAct范式,介绍不同来源对智能体的定义,详细阐述ReAct的核心思想——将推理与行动交错联合,形成Thought->Act->Observe工作流程。通过案例演示ReAct应用,探讨工具技术发展路径,总结智能体两大特征:LLM作为规划器进行自主推理,以及通过工具与外界交互获取信息,为理解大模型智能体提供基础框架。
1、 智能体是什么?
智能体这个词就像哈姆雷特,不同的人对其有不同的定义。
人工智能的经典巨著《人工智能:现代方法》将智能体定义为:任何通过传感器(sensor)感知环境(environment)并通过执行器(actuator)作用于该环境的事物都可以被视为智能体(agent)。
Google 将智能体定义为:AI 智能体是使用 AI 来实现目标并代表用户完成任务的软件系统。其表现出了推理、规划和记忆能力,并且具有一定的自主性,能够自主学习、适应和做出决定。
从概念上很难有效地理解智能体,所以笔者就换了个思路,先看具体的案例。
2、 ReAct
姚顺雨提出的 ReAct[3] 是一个基于 LLM 的智能体范式,这已得到广泛认可。
在 ReAct 之前,LLM 在完成任务时常采用这两类策略:
- • 纯推理(reason only):例如 Chain-of-Thought(思维链), 只让模型内部展开推理。这类方法能分解问题,但容易出现幻觉(hallucination)和错误累积。
- • 纯行动(act only):例如让模型输出行为/动作,与外界环境或 API 交互(比如查询知识库或执行步进任务)。这类方法能获取外部信息,但缺乏高层推理和规划能力。
ReAct 的核心思想是将推理与行动交错联合起来,形成一个更强、更鲁棒的任务求解范式:即通过模型交替产生推理内容与行动指令,并结合实际执行结果来进一步推理,从而实现推理与行动的协同。
2.1. Thought -> Act -> Observe
结合论文中的示例,比较容易理解其工作流程。
- LLM 思考任务目标、历史反馈,明确下一步行动的逻辑依据;
- LLM 生成下一步的行动,示例为知识问答,所以都是 Search 指令;
- 执行与外部交互的动作,将外部反馈传递给 LLM,为下一轮 TAO 提供信息。
仅从论文中的示例来看,ReAct 是一种 prompt 级别的范式设计,所以笔者决定通过手动操作来演示。
2.2. 人工 Act 示例
system 提示词来自旧版本的 LangChain:
Answer the following questions as best you can. You have access to the following tools: Search: A search engine. Usefulforwhen you need to answer questions about current events. Input should be a search query. Calculator: Usefulforwhen you need to answer questions about math. The way you use the tools is by specifying a json blob. Specifically, this json should have a`action`key(with the name of the tool to use)and a`action_input`key(with the input to the tool going here). The only values that should beinthe"action"field are: Search, Calculator The$JSON_BLOBshould only contain a SINGLE action,doNOTreturna list of multiple actions. Here is an example of a valid$JSON_BLOB:{"action":$TOOL_NAME,"action_input":$INPUT}ALWAYS use the following format: Question: the input question you must answer Thought: you should always think about what todoAction:$JSON_BLOBObservation: the result of the action...(this Thought/Action/Observation can repeat Ntimes)Thought: I now know the final answer Final Answer: the final answer to the original input question Begin!Reminder to always use the exact characters`Final Answer`when responding.这样发起 LLM 调用,需要注意 stop 的设置:
client.chat.completions.create(model="deepseek-chat",messages=[{"role":"system","content":system_prompt},{"role":"user","content":user_prompt},],temperature=0,stream=False, stop=["Observation:"])第一轮
请求LLM:
Question: 赵二狗的儿子是谁?他现在的年龄的2次方是多少?LLM响应:
Thought: 我需要先找出赵二狗的儿子是谁,然后获取他现在的年龄,最后计算年龄的平方。由于这是一个关于具体人物的问题,我需要使用搜索工具来查找相关信息。 Action:{"action":"Search","action_input":"赵二狗 儿子"}人工搜索:
赵二狗的儿子是钱小猫第二轮
请求LLM:
Question: 赵二狗的儿子是谁?他现在的年龄的2次方是多少? This was your previous work(but I haven't seen any of it!I only see what youreturnas final answer): Thought: 我需要先找出赵二狗的儿子是谁,然后获取他现在的年龄,最后计算年龄的平方。由于这是一个关于具体人物的问题,我需要使用搜索工具来查找相关信息。 Action:{"action":"Search","action_input":"赵二狗 儿子"}Observation: 赵二狗的儿子是钱小猫 Thought:LLM响应:
Thought: 现在我知道了赵二狗的儿子是钱小猫。接下来我需要查找钱小猫现在的年龄。由于年龄可能随时间变化,我需要搜索最新的信息。 Action:{"action":"Search","action_input":"钱小猫 年龄"}人工搜索:
钱小猫今年9岁第三轮
请求LLM:
Question: 赵二狗的儿子是谁?他现在的年龄的2次方是多少? This was your previous work(but I haven't seen any of it!I only see what youreturnas final answer): Thought: 我需要先找出赵二狗的儿子是谁,然后获取他现在的年龄,最后计算年龄的平方。由于这是一个关于具体人物的问题,我需要使用搜索工具来查找相关信息。 Action:{"action":"Search","action_input":"赵二狗 儿子"}Observation: 赵二狗的儿子是钱小猫 Thought: 现在我知道了赵二狗的儿子是钱小猫。接下来我需要查找钱小猫现在的年龄。由于年龄可能随时间变化,我需要搜索最新的信息。 Action:{"action":"Search","action_input":"钱小猫 年龄"}Observation: 钱小猫今年9岁 Thought:LLM响应:
Thought: 现在我知道钱小猫今年9岁。接下来我需要计算他年龄的平方,即9的2次方。这可以通过计算器工具来完成。 Action:{"action":"Calculator","action_input":"9 ** 2"}人工计算:
Answer: 81第四轮
请求LLM:
Question: 赵二狗的儿子是谁?他现在的年龄的2次方是多少? This was your previous work(but I haven't seen any of it!I only see what youreturnas final answer): Thought: 我需要先找出赵二狗的儿子是谁,然后获取他现在的年龄,最后计算年龄的平方。由于这是一个关于具体人物的问题,我需要使用搜索工具来查找相关信息。 Action:{"action":"Search","action_input":"赵二狗 儿子"}Observation: 赵二狗的儿子是钱小猫 Thought: 现在我知道了赵二狗的儿子是钱小猫。接下来我需要查找钱小猫现在的年龄。由于年龄可能随时间变化,我需要搜索最新的信息。 Action:{"action":"Search","action_input":"钱小猫 年龄"}Observation: 钱小猫今年9岁 Thought: 现在我知道钱小猫今年9岁。接下来我需要计算他年龄的平方,即9的2次方。这可以通过计算器工具来完成。 Action:{"action":"Calculator","action_input":"9 ** 2"}Observation: Answer:81Thought:LLM响应:
赵二狗的儿子是钱小猫,他今年9岁,年龄的平方是81。 Final Answer: 赵二狗的儿子是钱小猫,他现在的年龄的2次方是81。2.3. 工具的发展
在姚顺雨等人于2022年发表 ReAct 论文时,工具(tools)还只能通过提示词进行定义。然而自那时起,工具相关技术迅速演进,在功能定义、调用方式与应用范围等方面都取得了显著进展。
其中的一条线是训练模型学会使用工具。Meta 于2023年发表的 Toolformer[4] 可以说是一个里程碑,今天的主流大模型都在做 Toolformer 类似目标的后训练,但实现远比论文中描述的流水线更复杂、更系统化。
另外一条线是工具使用API的规范化。OpenAI 于2023年推出“函数调用”(Function Calling)特性,允许开发者在 Chat Completions API 中定义函数接口(函数签名 / JSON schema),并让模型智能输出函数名与参数供开发者执行对应动作[5];接着又于2025年发布了新的 Agents 平台及 Responses API,通过 Responses API 可以更方便地构建 agent,让模型与工具协作能力更强[6]。
3、总结
智能体在广义上难以给出明确定义,但是 ReAct 是基于 LLM 的智能体的基础范式。
从这个角度可以总结智能体的两大特征为:
- •LLM 是智能体的规划器,大模型自主推理生成 Thought,规划 Action,更复杂的范式还会进行反思 Reflection;
- •智能体通过工具与外界产生交互,获取的 Observe 为后续规划提供信息。
如何学习大模型 AI ?
由于新岗位的生产效率,要优于被取代岗位的生产效率,所以实际上整个社会的生产效率是提升的。
但是具体到个人,只能说是:
“最先掌握AI的人,将会比较晚掌握AI的人有竞争优势”。
这句话,放在计算机、互联网、移动互联网的开局时期,都是一样的道理。
我在一线科技企业深耕十二载,见证过太多因技术卡位而跃迁的案例。那些率先拥抱 AI 的同事,早已在效率与薪资上形成代际优势,我意识到有很多经验和知识值得分享给大家,也可以通过我们的能力和经验解答大家在大模型的学习中的很多困惑。我们整理出这套AI 大模型突围资料包:
- ✅ 从零到一的 AI 学习路径图
- ✅ 大模型调优实战手册(附医疗/金融等大厂真实案例)
- ✅ 百度/阿里专家闭门录播课
- ✅ 大模型当下最新行业报告
- ✅ 真实大厂面试真题
- ✅ 2025 最新岗位需求图谱
所有资料 ⚡️ ,朋友们如果有需要《AI大模型入门+进阶学习资源包》,下方扫码获取~
① 全套AI大模型应用开发视频教程
(包含提示工程、RAG、LangChain、Agent、模型微调与部署、DeepSeek等技术点)
② 大模型系统化学习路线
作为学习AI大模型技术的新手,方向至关重要。 正确的学习路线可以为你节省时间,少走弯路;方向不对,努力白费。这里我给大家准备了一份最科学最系统的学习成长路线图和学习规划,带你从零基础入门到精通!
③ 大模型学习书籍&文档
学习AI大模型离不开书籍文档,我精选了一系列大模型技术的书籍和学习文档(电子版),它们由领域内的顶尖专家撰写,内容全面、深入、详尽,为你学习大模型提供坚实的理论基础。
④ AI大模型最新行业报告
2025最新行业报告,针对不同行业的现状、趋势、问题、机会等进行系统地调研和评估,以了解哪些行业更适合引入大模型的技术和应用,以及在哪些方面可以发挥大模型的优势。
⑤ 大模型项目实战&配套源码
学以致用,在项目实战中检验和巩固你所学到的知识,同时为你找工作就业和职业发展打下坚实的基础。
⑥ 大模型大厂面试真题
面试不仅是技术的较量,更需要充分的准备。在你已经掌握了大模型技术之后,就需要开始准备面试,我精心整理了一份大模型面试题库,涵盖当前面试中可能遇到的各种技术问题,让你在面试中游刃有余。
以上资料如何领取?
为什么大家都在学大模型?
最近科技巨头英特尔宣布裁员2万人,传统岗位不断缩减,但AI相关技术岗疯狂扩招,有3-5年经验,大厂薪资就能给到50K*20薪!
不出1年,“有AI项目经验”将成为投递简历的门槛。
风口之下,与其像“温水煮青蛙”一样坐等被行业淘汰,不如先人一步,掌握AI大模型原理+应用技术+项目实操经验,“顺风”翻盘!
这些资料真的有用吗?
这份资料由我和鲁为民博士(北京清华大学学士和美国加州理工学院博士)共同整理,现任上海殷泊信息科技CEO,其创立的MoPaaS云平台获Forrester全球’强劲表现者’认证,服务航天科工、国家电网等1000+企业,以第一作者在IEEE Transactions发表论文50+篇,获NASA JPL火星探测系统强化学习专利等35项中美专利。本套AI大模型课程由清华大学-加州理工双料博士、吴文俊人工智能奖得主鲁为民教授领衔研发。
资料内容涵盖了从入门到进阶的各类视频教程和实战项目,无论你是小白还是有些技术基础的技术人员,这份资料都绝对能帮助你提升薪资待遇,转行大模型岗位。