Claude Code扒累了，Qwen的Skill生成同样不可错过

张开发

• 2026/4/5 8:51:18 • 15 分钟阅读

分享文章

在AI代理Agent日益复杂的今天为它们配备特定领域的技能至关重要。但手动编写技能耗时费力而自动生成的技能往往碎片化、不通用。最近来自阿里Qwen团队、ETH苏黎世、北大等机构的研究者提出了一种名为Trace2Skill的新框架它通过并行分析大量执行轨迹并归纳推理出通用模式从而生成可迁移、高质量的技能。这项工作挑战了“经验必然与模型或任务绑定”的传统观念证明经验可以被蒸馏成与模型无关的声明式技能甚至能让小模型如35B参数生成的技能提升大模型如122B参数的性能。传统技能生成的瓶颈当前LLM代理的技能生成主要面临两个挑战手动编写 scalability 差随着应用场景复杂化人工编写和维护技能成为瓶颈。自动生成质量低基于参数知识生成的技能缺乏领域细节而在线顺序更新如根据新轨迹不断修改技能容易过拟合导致技能碎片化。研究者观察到人类专家编写技能时会先广泛分析领域经验再提炼成单一、全面的指南。而现有方法要么是“见一个改一个”顺序更新要么生成一堆小技能碎片化都与人类专家的做法相悖。Trace2Skill框架Trace2Skill的核心思想是模拟人类专家的技能编写过程先并行分析大量执行轨迹再归纳出通用规则最终生成一个统一、无冲突的技能文档。1. 三个阶段流程Trace2Skill的流程分为三个阶段阶段1轨迹生成使用初始技能S0让代理在并行任务上执行收集成功T和失败T-的轨迹。这一步完全可并行化效率很高。阶段2并行多代理补丁提议分配一组“分析师”子代理每个独立分析一条轨迹提出技能修改补丁Patch。成功分析师A单次调用从成功轨迹中提取通用行为模式。错误分析师A-采用多轮交互式诊断ReAct循环深入排查失败根因确保补丁基于验证过的原因。所有分析师并行工作互不干扰保留多样性。阶段3无冲突整合将所有补丁通过分层合并类似二叉树合并整合成一个统一的技能更新。合并过程会去重、解决冲突如同文件同范围的编辑。归纳推理只保留高频出现的模式认为其更可能通用低频补丁则移至参考资料。最终生成新技能S*可直接使用无需检索模块。2. 两种工作模式技能深化基于现有高质量人工技能如Anthropic官方xlsx技能用轨迹经验进一步优化。技能创建从零开始基于参数知识生成的粗糙技能通过轨迹经验蒸馏出实用技能。小模型生成的技能大模型也能用研究者在多个领域验证了Trace2Skill的效果1. 电子表格任务SpreadsheetBench技能深化用122B模型生成的技能让35B模型的性能提升27个百分点验证集。技能创建用35B模型从零生成的技能让122B模型在WikiTableQuestionsOOD任务上提升57.65个百分点对比基线Trace2Skill显著优于人工技能跨模型时可能失效和纯参数知识技能。2. 数学推理DAPO-Math AIME技能在数学领域同样有效且能跨模型迁移35B生成的技能提升122B模型性能。3. 视觉问答DocVQA122B模型生成的技能对35B模型也有显著提升说明技能编写能力与任务执行能力可分离。4. 与传统方法对比并行 vs. 顺序更新并行整合效率更高3分钟 vs. 60分钟且避免顺序过拟合。蒸馏技能 vs. 检索记忆库Trace2Skill生成的单一技能文档比基于检索的经验银行ReasoningBank更通用尤其在跨任务时。交互式错误分析 vs. 单次LLM调用A-代理的多轮诊断能更准确定位根因生成的技能迁移性更强。为什么有效Trace2Skill成功的核心在于归纳推理从大量轨迹中提取高频模式如“公式重算后必须验证”编码为通用规则。低频或特定案例的补丁被移至参考资料保持主技能简洁。分层合并机制自动形成“主文档参考资料”的层次结构模仿人类专家的知识组织方式。总结与展望Trace2Skill证明了经验可以蒸馏即使基于小模型的轨迹也能生成可跨模型、跨任务迁移的技能。并行分析优于顺序更新更高效避免过拟合。声明式技能优于检索记忆无需外部模块直接集成到代理中。未来工作可包括量化每个补丁的因果效应进一步优化合并策略。一句话总结Trace2Skill让AI代理像人类专家一样从大量经验中“举一反三”提炼出通用技能且小模型也能教大模型学AI大模型的正确顺序千万不要搞错了2026年AI风口已来各行各业的AI渗透肉眼可见超多公司要么转型做AI相关产品要么高薪挖AI技术人才机遇直接摆在眼前有往AI方向发展或者本身有后端编程基础的朋友直接冲AI大模型应用开发转岗超合适就算暂时不打算转岗了解大模型、RAG、Prompt、Agent这些热门概念能上手做简单项目也绝对是求职加分王给大家整理了超全最新的AI大模型应用开发学习清单和资料手把手帮你快速入门学习路线:✅大模型基础认知—大模型核心原理、发展历程、主流模型GPT、文心一言等特点解析✅核心技术模块—RAG检索增强生成、Prompt工程实战、Agent智能体开发逻辑✅开发基础能力—Python进阶、API接口调用、大模型开发框架LangChain等实操✅应用场景开发—智能问答系统、企业知识库、AIGC内容生成工具、行业定制化大模型应用✅项目落地流程—需求拆解、技术选型、模型调优、测试上线、运维迭代✅面试求职冲刺—岗位JD解析、简历AI项目包装、高频面试题汇总、模拟面经以上6大模块看似清晰好上手实则每个部分都有扎实的核心内容需要吃透我把大模型的学习全流程已经整理好了抓住AI时代风口轻松解锁职业新可能希望大家都能把握机遇实现薪资/职业跃迁这份完整版的大模型 AI 学习资料已经上传CSDN朋友们如果需要可以微信扫描下方CSDN官方认证二维码免费领取【保证100%免费】

更多文章

前端开发 2026/4/5 8:47:58

旧iOS设备复活指南：让你的iPhone/iPad重获新生

旧iOS设备复活指南：让你的iPhone/iPad重获新生【免费下载链接】Legacy-iOS-Kit An all-in-one tool to restore/downgrade, save SHSH blobs, jailbreak legacy iOS devices, and more 项目地址: https://gitcode.com/gh_mirrors/le/Legacy-iOS-Kit 你是否曾…

OpenClaw飞书机器人集成：Phi-3-vision-128k-instruct多模态对话实战 1. 为什么选择OpenClaw飞书Phi-3的组合？ 去年我在团队内部尝试搭建知识库问答系统时，发现传统方案存在两个痛点：一是纯文本模型无法理解同事随手拍的示意图&a…

张开发

前端开发 2026/4/5 8:19:28

BGE Reranker-v2-m3在智能法律咨询系统中的应用

BGE Reranker-v2-m3在智能法律咨询系统中的应用 1. 引言想象一下这样的场景：一位普通市民遇到了法律问题，打开智能法律咨询系统输入"租房合同纠纷怎么处理"，系统瞬间从海量法律条文和案例中筛选出最相关的信息。但有时候&#x…

张开发

Claude Code扒累了，Qwen的Skill生成同样不可错过

最新文章

校园快递|基于springboot + vue校园快递管理系统(源码+数据库+文档)

如何3分钟搞定全网音乐歌词：163MusicLyrics完整指南

免费文档下载终极指南：kill-doc开源工具如何突破30+平台限制

3分钟上手B站视频下载神器：BilibiliDown让离线观看变得如此简单

Intel(R) Wireless-AC 9461适配器WLAN连接故障（错误代码10）的实用修复指南

OpCore-Simplify：智能化工具驱动的OpenCore EFI构建效率提升实践

推荐文章

OpenClaw云端集成Skill流程：2026年部署、配置大模型百炼APIKey、接入钉钉/QQ/飞书/微信

Python flask django高校餐饮档口管理系统的设计与实现

超实用指南：3步打造可移植版waifu2x-caffe

Go语言的JSON处理技巧

2025届毕业生推荐的AI科研平台推荐榜单

前端性能监控吐槽：别再让你的网站慢得像蜗牛！

相关文章

探索Akagi：实时牌局分析与AI决策支持的麻将辅助系统

SEO 视频在不同行业的应用有何差异_SEO 视频的长度应该控制在什么范围内

基于YOLO+DeepSeek的农作物病虫害检测与环境监测一体化智能平台植物病虫害识别系统

生成式引擎优化（GEO）实战指南：从技术架构到行业落地

嵌入式开发调试宏与性能优化实战

LosslessCut：解锁无损视频编辑的5个专业技巧

分享文章

更多文章

旧iOS设备复活指南：让你的iPhone/iPad重获新生

工业级日志分析新思路：使用BERT分割模型解析复杂系统日志

Ubuntu系统性能优化：让MusePublic艺术创作引擎运行更流畅

OpenClaw模型热切换技巧：Qwen3-14B与本地模型混合调用

清音刻墨Qwen3进阶技巧：批量处理、API调用，解锁高效工作流

图像融合新突破：RFN-Nest两阶段训练策略详解与调参技巧

SVG有源电力滤波器（APF）全套系统设计方案：硬件电路原理图、PCB与BOM文件及嵌入式软件...

抖音无水印视频下载终极指南：5分钟快速上手免费批量下载工具

TrollInstallerX终极指南：如何在iOS 14-16.6.1上快速安装TrollStore

OpenClaw飞书机器人配置：千问3.5-9B实现对话触发任务

OpenClaw飞书机器人集成：Phi-3-vision-128k-instruct多模态对话实战

BGE Reranker-v2-m3在智能法律咨询系统中的应用

Claude Code扒累了，Qwen的Skill生成同样不可错过

最新文章

校园快递|基于springboot + vue校园快递管理系统(源码+数据库+文档)

如何3分钟搞定全网音乐歌词：163MusicLyrics完整指南

免费文档下载终极指南：kill-doc开源工具如何突破30+平台限制

3分钟上手B站视频下载神器：BilibiliDown让离线观看变得如此简单

Intel(R) Wireless-AC 9461适配器WLAN连接故障（错误代码10）的实用修复指南

OpCore-Simplify：智能化工具驱动的OpenCore EFI构建效率提升实践

推荐文章

OpenClaw云端集成Skill流程：2026年部署、配置大模型百炼APIKey、接入钉钉/QQ/飞书/微信

Python flask django高校餐饮档口管理系统的设计与实现

超实用指南：3步打造可移植版waifu2x-caffe

Go语言的JSON处理技巧

2025届毕业生推荐的AI科研平台推荐榜单

前端性能监控吐槽：别再让你的网站慢得像蜗牛！

相关文章

探索Akagi：实时牌局分析与AI决策支持的麻将辅助系统

SEO 视频在不同行业的应用有何差异_SEO 视频的长度应该控制在什么范围内

基于YOLO+DeepSeek的农作物病虫害检测与环境监测一体化智能平台 植物病虫害识别系统

生成式引擎优化（GEO）实战指南：从技术架构到行业落地

嵌入式开发调试宏与性能优化实战

LosslessCut：解锁无损视频编辑的5个专业技巧

分享文章

更多文章

基于YOLO+DeepSeek的农作物病虫害检测与环境监测一体化智能平台植物病虫害识别系统