背景:
六个月前,我花了两周时间搭建了一个 “智能” 客户支持智能体。它能解答问题、查询订单状态,甚至还能处理退款。当时我还挺引以为傲的。
但集成代码写得一团糟:到处都是定制化的 API 调用;只要缺失一个字段,JSON 解析就会崩溃;光是处理工具路由的函数就写了 400 行。不过好在 —— 大部分时候它还能正常运行。
直到我给团队做演示的那天。
有人问:“订单 12345 的状态是什么?”
智能体胸有成竹地给出了订单详情,一切都很顺利。可紧接着有人追问了一个问题,智能体试图再次调用订单查询函数 —— 偏偏这次,我那脆弱的解析逻辑在一个边缘场景下失效了。整个系统当着所有人的面崩溃了。
那晚我通宵调试,最终意识到问题根本不在逻辑本身,而是架构出了问题。我试图用定制化代码把大语言模型(LLM)和外部工具拼接起来,无异于搭建一座纸牌屋:每新增一个工具,就要