赤峰市网站建设_网站建设公司_网站制作_seo优化
2025/12/26 19:15:03 网站建设 项目流程

文章介绍Claude Skills的动态工具过滤功能,解决传统AI Agent工具调用时Token消耗大、模型困惑、响应慢等问题。通过动态加载和渐进式披露机制,Agent仅在识别用户意图匹配时加载相关工具,大幅提升效率。文章详解如何使用LangChain 1.1的Middleware API实现这一功能,包括动态工具过滤、状态管理和请求拦截等关键技术。


Claude Skills 的核心功能——动态工具过滤

  1. Claude Code Skills 背景介绍
    ==========================

Vibe Coding(氛围编程) 大家应该都听过,那它是怎么发展而来的呢?

第一代 AI 编码工具主要依赖于基于统计的补全技术,随后发展为以 GitHub Copilot 为代表的“中间填充”(Fill-in-the-Middle)预测模型,这些工具本质上是被动的,依赖开发者提供明确的上下文和光标位置。然而,随着模型推理能力的飞跃,特别是 Anthropic Claude 系列模型在长上下文处理和逻辑推理方面的突破,一种新的范式即代理式编程(Agentic Coding)应运而生。

Claude Code 的出现,其不仅仅是一个运行在终端中的 CLI 工具,而是一个具备自主规划与执行能力的智能代理 。与传统的 CLI 工具不同,Claude Code 被设计为能够理解自然语言指令,并将其转化为一系列复杂的系统操作,包括文件编辑、代码运行、Git 版本控制管理以及错误调试 。它遵循 Unix 哲学,具有高度的可组合性(Composable)和可脚本化(Scriptable)特征,能够与其他命令行工具通过管道(Pipe)进行交互 。

Claude Code 的核心竞争力在于其“全栈意识”。它不仅仅关注当前打开的文件,而是能够通过索引和检索机制理解整个代码库的架构、依赖关系以及业务逻辑 。这种能力使得开发者可以从繁琐的语法细节中解脱出来,转向更高层次的架构设计和意图表达,这种工作流在社区中被形象地称为“氛围编程”(Vibe Coding)

在 Claude Code 的架构中,Skill(技能) 扮演着至关重要的角色。如果说 Claude 模型是大脑,MCP 是连接外部世界的手脚,那么 Skill 就是存储特定领域专业知识的操作手册。

虽然 Claude Opus 4.5 拥有广泛的编程知识,但它并不了解某家特定初创公司的内部部署脚本、某种冷门框架的特殊配置,或者某个团队特定的代码审查规范。传统的解决方案是将这些信息全部塞入系统提示词(System Prompt)或上下文窗口中,但这会导致两个问题:一是上下文窗口迅速耗尽,增加了推理成本(Token Economics);二是过多的无关信息会干扰模型的注意力,导致“迷失中间”(Lost in the Middle)现象。

Skill 通过引入动态加载(Dynamic Loading)和渐进式披露(Progressive Disclosure) 机制,优雅地解决了这一难题。它允许开发者将海量的程序性知识(Procedural Knowledge)封装在本地文件系统中,Agent 仅在识别到用户意图与某个 Skill 匹配时,才会按需加载相关的指令和脚本 。这种架构不仅极大地扩展了 Agent 的能力边界,还保证了推理的高效性和准确性。

  1. Claude Skills 给予Agent的启发
    ===========================
  • 大模型的工具调用流程

传统的 AI Agent 在处理任务时,会将所有可用的工具(Tools)一次性暴露给大语言模型。想象一下,如果你有 50 个工具,每次模型调用都需要处理这 50 个工具的描述信息,

这会带来几个严重问题:

  1. Token 消耗巨大

    :每个工具的描述可能有几百个 token,50 个工具就是上万个 token;

  2. 大模型困惑

    :面对过多选择,模型容易选错工具或产生幻觉;

  3. 响应延迟

    :处理大量工具描述需要更长时间;

  4. 成本高昂

    :API 调用按 token 计费,浪费严重;

Claude Skills 的核心思想是:让模型在每次调用时只看到「相关的」工具,而不是全部工具。这就像一个智能助手,只有当你说"我要分析数据"时,才会把数据分析相关的工具拿出来;说"我要处理 PDF"时,才会展示 PDF 处理工具。

接下来,我们就通过底层技术来复现这个非常高价值的Agent开发模式。

  • 为什么选择 LangChain 1.1

LangChain 1.1 版本最大的优势就是在LangGraph之上构建并集成了革命性的 Middleware API。

这个 Middleware API 允许我们在 Agent 的执行流程中插入自定义逻辑,实现:

  • 动态工具过滤:在每次模型调用前修改工具列表

  • 状态管理:通过 state_schema 追踪运行时状态

  • 请求拦截:使用 request.override() 修改请求参数

在 LangChain 1.1 之前,实现动态工具过滤需要复杂的 hack,比如重写 Agent 类或修改工具列表。现在,通过官方支持的 Middleware API,我们可以优雅地实现这一功能。

# 基础库导入 import os import sys from pathlib import Path from typing import List, Callable, Any, Optional from typing_extensions import TypedDict # 加载环境变量 from dotenv import load_dotenv load_dotenv(override=True) # LangChain 1.1 核心导入 from langchain.agents import create_agent from langchain.agents.middleware import ( AgentMiddleware, ModelRequest, ModelResponse, ) from langchain_core.tools import BaseTool, tool from langchain_core.messages import HumanMessage, AIMessage, BaseMessage print("核心库导入成功")

上面的代码导入了我们需要的所有核心组件。特别注意 langchain.agents.middleware 模块,这是 LangChain 1.1 新增的关键模块,包含了:

AgentMiddleware:中间件基类,我们需要继承它;

ModelRequest:封装了模型调用请求的所有信息(消息、工具、状态等);

ModelResponse:模型调用的响应;

写在最后

本文介绍了如何使用 LangChain 1.1 的 Middleware 机制实现 Claude Skills 动态工具过滤。虽然没有把完全的过程demo 展示出来,但是核心概念如下:

  1. Middleware 机制
  • 作用:在 Agent 执行流程中插入自定义逻辑

  • 核心方法:wrap_model_call(request, handler)

  • 关键操作:request.override(tools=filtered_tools)

  1. State Schema
  • 作用:定义 Agent 运行时需要追踪的状态

  • 实现:使用 TypedDict 定义结构

  • 访问:通过 request.state.get(“key”) 获取

  1. 动态工具过滤
  • 原理:根据当前状态(skills_loaded)决定暴露哪些工具

  • 好处:减少 token 消耗、降低错误率、提升响应速度

  • 实现:在 Middleware 中过滤并替换工具列表

AI时代,未来的就业机会在哪里?

答案就藏在大模型的浪潮里。从ChatGPT、DeepSeek等日常工具,到自然语言处理、计算机视觉、多模态等核心领域,技术普惠化、应用垂直化与生态开源化正催生Prompt工程师、自然语言处理、计算机视觉工程师、大模型算法工程师、AI应用产品经理等AI岗位。

掌握大模型技能,就是把握高薪未来。

那么,普通人如何抓住大模型风口?

AI技术的普及对个人能力提出了新的要求,在AI时代,持续学习和适应新技术变得尤为重要。无论是企业还是个人,都需要不断更新知识体系,提升与AI协作的能力,以适应不断变化的工作环境。

因此,这里给大家整理了一份《2025最新大模型全套学习资源》,包括2025最新大模型学习路线、大模型书籍、视频教程、项目实战、最新行业报告、面试题等,带你从零基础入门到精通,快速掌握大模型技术!

由于篇幅有限,有需要的小伙伴可以扫码获取!

1. 成长路线图&学习规划

要学习一门新的技术,作为新手一定要先学习成长路线图,方向不对,努力白费。这里,我们为新手和想要进一步提升的专业人士准备了一份详细的学习成长路线图和规划。

2. 大模型经典PDF书籍

书籍和学习文档资料是学习大模型过程中必不可少的,我们精选了一系列深入探讨大模型技术的书籍和学习文档,它们由领域内的顶尖专家撰写,内容全面、深入、详尽,为你学习大模型提供坚实的理论基础(书籍含电子版PDF)

3. 大模型视频教程

对于很多自学或者没有基础的同学来说,书籍这些纯文字类的学习教材会觉得比较晦涩难以理解,因此,我们提供了丰富的大模型视频教程,以动态、形象的方式展示技术概念,帮助你更快、更轻松地掌握核心知识

4. 大模型项目实战

学以致用,当你的理论知识积累到一定程度,就需要通过项目实战,在实际操作中检验和巩固你所学到的知识,同时为你找工作和职业发展打下坚实的基础。

5. 大模型行业报告

行业分析主要包括对不同行业的现状、趋势、问题、机会等进行系统地调研和评估,以了解哪些行业更适合引入大模型的技术和应用,以及在哪些方面可以发挥大模型的优势。

6. 大模型面试题

面试不仅是技术的较量,更需要充分的准备。

在你已经掌握了大模型技术之后,就需要开始准备面试,我们将提供精心整理的大模型面试题库,涵盖当前面试中可能遇到的各种技术问题,让你在面试中游刃有余。

为什么大家都在学AI大模型?

随着AI技术的发展,企业对人才的需求从“单一技术”转向 “AI+行业”双背景。企业对人才的需求从“单一技术”转向 “AI+行业”双背景。金融+AI、制造+AI、医疗+AI等跨界岗位薪资涨幅达30%-50%。

同时很多人面临优化裁员,近期科技巨头英特尔裁员2万人,传统岗位不断缩减,因此转行AI势在必行!

这些资料有用吗?

这份资料由我们和鲁为民博士(北京清华大学学士和美国加州理工学院博士)共同整理,现任上海殷泊信息科技CEO,其创立的MoPaaS云平台获Forrester全球’强劲表现者’认证,服务航天科工、国家电网等1000+企业,以第一作者在IEEE Transactions发表论文50+篇,获NASA JPL火星探测系统强化学习专利等35项中美专利。本套AI大模型课程由清华大学-加州理工双料博士、吴文俊人工智能奖得主鲁为民教授领衔研发。

资料内容涵盖了从入门到进阶的各类视频教程和实战项目,无论你是小白还是有些技术基础的技术人员,这份资料都绝对能帮助你提升薪资待遇,转行大模型岗位。


大模型全套学习资料已整理打包,有需要的小伙伴可以微信扫描下方CSDN官方认证二维码,免费领取【保证100%免费】

需要专业的网站建设服务?

联系我们获取免费的网站建设咨询和方案报价,让我们帮助您实现业务目标

立即咨询