Claude Code扒累了,Qwen的Skill生成同样不可错过

张开发
2026/4/5 8:51:18 15 分钟阅读

分享文章

Claude Code扒累了,Qwen的Skill生成同样不可错过
在AI代理Agent日益复杂的今天为它们配备特定领域的技能至关重要。但手动编写技能耗时费力而自动生成的技能往往碎片化、不通用。最近来自阿里Qwen团队、ETH苏黎世、北大等机构的研究者提出了一种名为Trace2Skill的新框架它通过并行分析大量执行轨迹并归纳推理出通用模式从而生成可迁移、高质量的技能。这项工作挑战了“经验必然与模型或任务绑定”的传统观念证明经验可以被蒸馏成与模型无关的声明式技能甚至能让小模型如35B参数生成的技能提升大模型如122B参数的性能。传统技能生成的瓶颈当前LLM代理的技能生成主要面临两个挑战手动编写 scalability 差随着应用场景复杂化人工编写和维护技能成为瓶颈。自动生成质量低基于参数知识生成的技能缺乏领域细节而在线顺序更新如根据新轨迹不断修改技能容易过拟合导致技能碎片化。研究者观察到人类专家编写技能时会先广泛分析领域经验再提炼成单一、全面的指南。而现有方法要么是“见一个改一个”顺序更新要么生成一堆小技能碎片化都与人类专家的做法相悖。Trace2Skill框架Trace2Skill的核心思想是模拟人类专家的技能编写过程先并行分析大量执行轨迹再归纳出通用规则最终生成一个统一、无冲突的技能文档。1. 三个阶段流程Trace2Skill的流程分为三个阶段阶段1轨迹生成使用初始技能S0让代理在并行任务上执行收集成功T和失败T-的轨迹。这一步完全可并行化效率很高。阶段2并行多代理补丁提议分配一组“分析师”子代理每个独立分析一条轨迹提出技能修改补丁Patch。成功分析师A单次调用从成功轨迹中提取通用行为模式。错误分析师A-采用多轮交互式诊断ReAct循环深入排查失败根因确保补丁基于验证过的原因。 所有分析师并行工作互不干扰保留多样性。阶段3无冲突整合将所有补丁通过分层合并类似二叉树合并整合成一个统一的技能更新。合并过程会去重、解决冲突如同文件同范围的编辑。归纳推理只保留高频出现的模式认为其更可能通用低频补丁则移至参考资料。 最终生成新技能S*可直接使用无需检索模块。2. 两种工作模式技能深化基于现有高质量人工技能如Anthropic官方xlsx技能用轨迹经验进一步优化。技能创建从零开始基于参数知识生成的粗糙技能通过轨迹经验蒸馏出实用技能。小模型生成的技能大模型也能用研究者在多个领域验证了Trace2Skill的效果1. 电子表格任务SpreadsheetBench技能深化用122B模型生成的技能让35B模型的性能提升27个百分点验证集。技能创建用35B模型从零生成的技能让122B模型在WikiTableQuestionsOOD任务上提升57.65个百分点对比基线Trace2Skill显著优于人工技能跨模型时可能失效和纯参数知识技能。2. 数学推理DAPO-Math AIME技能在数学领域同样有效且能跨模型迁移35B生成的技能提升122B模型性能。3. 视觉问答DocVQA122B模型生成的技能对35B模型也有显著提升说明技能编写能力与任务执行能力可分离。4. 与传统方法对比并行 vs. 顺序更新并行整合效率更高3分钟 vs. 60分钟且避免顺序过拟合。蒸馏技能 vs. 检索记忆库Trace2Skill生成的单一技能文档比基于检索的经验银行ReasoningBank更通用尤其在跨任务时。交互式错误分析 vs. 单次LLM调用A-代理的多轮诊断能更准确定位根因生成的技能迁移性更强。为什么有效Trace2Skill成功的核心在于归纳推理从大量轨迹中提取高频模式如“公式重算后必须验证”编码为通用规则。低频或特定案例的补丁被移至参考资料保持主技能简洁。分层合并机制自动形成“主文档参考资料”的层次结构模仿人类专家的知识组织方式。总结与展望Trace2Skill证明了经验可以蒸馏即使基于小模型的轨迹也能生成可跨模型、跨任务迁移的技能。并行分析优于顺序更新更高效避免过拟合。声明式技能优于检索记忆无需外部模块直接集成到代理中。未来工作可包括量化每个补丁的因果效应进一步优化合并策略。一句话总结Trace2Skill让AI代理像人类专家一样从大量经验中“举一反三”提炼出通用技能且小模型也能教大模型学AI大模型的正确顺序千万不要搞错了2026年AI风口已来各行各业的AI渗透肉眼可见超多公司要么转型做AI相关产品要么高薪挖AI技术人才机遇直接摆在眼前有往AI方向发展或者本身有后端编程基础的朋友直接冲AI大模型应用开发转岗超合适就算暂时不打算转岗了解大模型、RAG、Prompt、Agent这些热门概念能上手做简单项目也绝对是求职加分王给大家整理了超全最新的AI大模型应用开发学习清单和资料手把手帮你快速入门学习路线:✅大模型基础认知—大模型核心原理、发展历程、主流模型GPT、文心一言等特点解析✅核心技术模块—RAG检索增强生成、Prompt工程实战、Agent智能体开发逻辑✅开发基础能力—Python进阶、API接口调用、大模型开发框架LangChain等实操✅应用场景开发—智能问答系统、企业知识库、AIGC内容生成工具、行业定制化大模型应用✅项目落地流程—需求拆解、技术选型、模型调优、测试上线、运维迭代✅面试求职冲刺—岗位JD解析、简历AI项目包装、高频面试题汇总、模拟面经以上6大模块看似清晰好上手实则每个部分都有扎实的核心内容需要吃透我把大模型的学习全流程已经整理好了抓住AI时代风口轻松解锁职业新可能希望大家都能把握机遇实现薪资/职业跃迁这份完整版的大模型 AI 学习资料已经上传CSDN朋友们如果需要可以微信扫描下方CSDN官方认证二维码免费领取【保证100%免费】

更多文章