鄂州市网站建设_网站建设公司_JavaScript_seo优化
2026/1/9 19:17:19 网站建设 项目流程

本文从前端开发角度全面介绍AI Agent开发所需知识,包括LLM大语言模型基础、Prompt Engineering提示词工程、LangChain.js工具链使用、RAG检索增强生成技术、Agent工作流构建、MCP模型上下文协议以及多模态应用开发。文章详细阐述了各技术要点与实践方法,助力前端开发者掌握AI Agent全栈开发能力,构建智能化应用,适应"人工智能+"时代的技术需求。


开始

AI 刚开始出现的时候就是一个 chatbot 聊天对话框,后来逐步增加功能,可以连网、可以配置 tools 和 MCP ,再到 Agent 自定义工作流。有了 Agent 就可以把 AI 应用到各个真实的业务场景中,这是一个逐步进化和落地的过程。

例如我们程序员最熟悉的 AI 编程就是一个 AI Agent 很好的落地,就在这 1 年之间已经广泛应用。Dify 和 Coze 等平台可以直接手动定义工作流,配置出一些个性需求的 AI Agent 并发布使用。

8 月底国家颁布了“人工智能+”的行动意见,无论是中国还是世界的 AI 应用将会在未来 10 年内持续发展,遍地开花。

我个人也会继续在 AI Agent 领域继续深耕,把我擅长的面试、刷题、简历、教程等领域全部 AI 赋能,使用 AI 增加效率,以更快捷的服务于更多用户。

本文站在前端开发人员角度,介绍开发 AI Agent 智能体所需要掌握的知识范围,供大家参考。

LLM

AI 的基础是 LLM 大语言模型,例如现在大家熟知的 ChatGPT Gemini Claude Deepseek Qwen Grok Llama 等。我们常见的使用方式是在线调用它们的 API (可能要付费购买 token),当然也可以本地部署内网使用。

LLM 是什么呢?当前所有 LLM 的核心简单理解就是:预测下一个词。

LLM 不是“聪明”,也不能理解人话,而是“被喂了整个互联网数据然后疯狂**「补全」**”。你设计得越好,它补全得越准。LLM 参数就是“记忆单元”,像人的神经元,参数越多(训练成本大、运行成本大)也就越“聪明”,补全的越准。

例如你的输入是“猴子喜欢吃”,LLM 会在自己海量的训练数据中计算,找到一个列表,其中“香蕉”的概率最大,它就返回“香蕉”。包括写诗、写代码、画图,也是根据 prompt 输入来补全内容,只不过不是一个词,而是海量数据训练出来的一个结构化输出。

包括 Agent 和 tool 也是一种“补全”,根据 prompt 去猜测使用哪些 tools (每个 tool 都有描述、参数结构)

LLM 的两种交互方式:

  • Completion 模式(纯文本补全)👉 GPT-3 —— 现在基本不用了
  • Chat 模式(对话形式,输入消息列表,输出新内容)👉 GPT-3.5/4

MoE 混合专家模式,拆分多个子 LLM (总的太大了参数太多了)每次只激活其中几个,这样运行成本低。 模型微调也是调整其中很少一部分参数,改变它的预测取向。

Prompt Engineering

AI 的生成内容和质量是严重依赖于 prompt 提示词的,你给出的提示词模糊,它生成的就一定是模糊的答案。

例如,我们在使用 Cursor 时一般要写一个 cursor rule 文件,规范代码标准,这就是提示词的一部分。

严格来说,Prompt Engineering 提示词工程 并不是什么技能,它就是一些沟通方式,很容易理解

我们可以通过提示词来约束用户的提问,如 github copilot 只专注于编程领域,问其他问题它不回答。

还可以通过 CoT 思维链模式,引导大模型按照我们的思路去思考。还可以规范 AI 的输出格式,或让 AI 做出一些判断和选择。

在实际开发过程中,每次调用 AI 请求我们都会认真思考提示词该如何写,甚至会使用 AI 写提示词,或者在线生成提示词。并不是用户输入什么,就原本的传给 AI 接口,要做很多包装和转述。

LangChian.js

LangChain.js 是前端人员使用 Nodejs 开发 AI 应用的首选,它的 LangGraph 可以自定义 Agent 工作流,它的 LangSmith 跟踪和分析 Agent 运作流程。LangChain 是一个非常好的开发生态。

我此前写过几篇 LangChain 相关的文章,可作为学习参考

  • 30 行代码 langChain.js 开发你的第一个 Agent
  • 使用 langChain.js 实现 RAG 知识库语义搜索
  • 使用 langChian.js 实现掘金“智能总结” 考虑大文档和 token 限制

RAG

Retrieval-Augmented Generation 检索增强生成,这是 AI 搜索资料辅助生成答案的有效方式。

它的核心步骤是:1. 把资料拆分为向量格式,存储在向量数据库;2. 用户提问时去向量数据库检索相关答案;3. 把这些相关答案发送给 AI 配合一起生成最终答案。具体案例可参考我写的博客 使用 langChain.js 实现 RAG 知识库语义搜索

对于前端开发人员,不太好理解的就是 Vector 向量。

Vector 向量,就是坐标。生活中常见的有二维、三维坐标,方便计算距离。

而我们可以把一段文本、图片等,转换为多维(几百维度)坐标(float 数组),两个坐标的距离(如欧氏距离、余弦相似度),就是两段文本(或图片)的相似度。

Elastic Search 可实现搜索引擎,但它只是关键词匹配,例如“教程”关键词匹配不到“课程”,它是严格的文字匹配。而向量就能匹配到,它是相似度匹配,语义搜索。PS.现在 elastic cloud 也有向量存储。

Vector store 向量存储技术选型:开发阶段用 Chroma,部署后切换为 Pinecone 或 Supabase 都有免费试用额度。

Agent

Agent 是一个综合体,它主要包含

  • LLM 大模型,负责思考和生成内容,一个 Agent 可以有多个 LLM ,不同节点配置不同的 LLM
  • workflow 工作流:定义节点、方向、判断,以实现 Re-Act ,让 AI Agent 自行判断逻辑
  • tools 工具:调用外部的服务,例如搜索、查询数据库等
  • memory 记忆和存储:记录当前对话和用户的关键信息

下图是 Flowise (类似于 Dify 和 Coze)给出的一个 RAG Agent 工作流配置的示例。

MCP

Model Context Protocol 模型上下文协议,是规定大模型参数和调用的一种协议,让 AI 可统一调用第三方的服务。

当前我们谈 AI MCP 主要是说各个 MCP server 能够提供的能力,例如我之前的文章编程常用的 MCP Server,用自然语言写代码 总结了编程常见的 MCP server 。

还有,我们也要能自己开发 MCP server 以及开发 client 去调用 server ,要有这方面的能力,可参考我的博客 Nodejs + Deepseek 开发 MCP Server 和 Client 踩坑记录

多模态

现在的 AI 应用不仅仅是文字聊天,你可以可以上传图片、PDF、word、甚至音频和视频,都可以传给 AI 大模型进行处理。同时,AI 大模型也可以生成图片、PDF、音频和视频。即,现在的 AI 应用要支持多模态。

AI 生成的非文字内容,往往通过 Artifact 形式展示。例如使用 Claude 生成一个 HTML 网页,它在右侧直接展示了网页渲染效果,并且还支持发布上线。

不同的 AI 大模型擅长不同的模态形式,也有不同的 API 调用方式和参数的写法。

其他

AI Agent 还在发展之中,还有更多的技术需要学习和实践,后面我会逐步分享

  • Multi-agent 多智能体架构
  • A2A 协议,Agent 和 Agent 之间的通讯协议
  • Context Engineering 上下文工程
  • AG-UI 协议,Agent 和 UI 的通讯协议

AI时代,未来的就业机会在哪里?

答案就藏在大模型的浪潮里。从ChatGPT、DeepSeek等日常工具,到自然语言处理、计算机视觉、多模态等核心领域,技术普惠化、应用垂直化与生态开源化正催生Prompt工程师、自然语言处理、计算机视觉工程师、大模型算法工程师、AI应用产品经理等AI岗位。

掌握大模型技能,就是把握高薪未来。

那么,普通人如何抓住大模型风口?

AI技术的普及对个人能力提出了新的要求,在AI时代,持续学习和适应新技术变得尤为重要。无论是企业还是个人,都需要不断更新知识体系,提升与AI协作的能力,以适应不断变化的工作环境。

因此,这里给大家整理了一份《2026最新大模型全套学习资源》,包括2026最新大模型学习路线、大模型书籍、视频教程、项目实战、最新行业报告、面试题等,带你从零基础入门到精通,快速掌握大模型技术!

由于篇幅有限,有需要的小伙伴可以扫码获取!

1. 成长路线图&学习规划

要学习一门新的技术,作为新手一定要先学习成长路线图,方向不对,努力白费。这里,我们为新手和想要进一步提升的专业人士准备了一份详细的学习成长路线图和规划。

2. 大模型经典PDF书籍

书籍和学习文档资料是学习大模型过程中必不可少的,我们精选了一系列深入探讨大模型技术的书籍和学习文档,它们由领域内的顶尖专家撰写,内容全面、深入、详尽,为你学习大模型提供坚实的理论基础(书籍含电子版PDF)

3. 大模型视频教程

对于很多自学或者没有基础的同学来说,书籍这些纯文字类的学习教材会觉得比较晦涩难以理解,因此,我们提供了丰富的大模型视频教程,以动态、形象的方式展示技术概念,帮助你更快、更轻松地掌握核心知识

4. 大模型项目实战

学以致用,当你的理论知识积累到一定程度,就需要通过项目实战,在实际操作中检验和巩固你所学到的知识,同时为你找工作和职业发展打下坚实的基础。

5. 大模型行业报告

行业分析主要包括对不同行业的现状、趋势、问题、机会等进行系统地调研和评估,以了解哪些行业更适合引入大模型的技术和应用,以及在哪些方面可以发挥大模型的优势。

6. 大模型面试题

面试不仅是技术的较量,更需要充分的准备。

在你已经掌握了大模型技术之后,就需要开始准备面试,我们将提供精心整理的大模型面试题库,涵盖当前面试中可能遇到的各种技术问题,让你在面试中游刃有余。

为什么大家都在学AI大模型?

随着AI技术的发展,企业对人才的需求从“单一技术”转向 “AI+行业”双背景。企业对人才的需求从“单一技术”转向 “AI+行业”双背景。金融+AI、制造+AI、医疗+AI等跨界岗位薪资涨幅达30%-50%。

同时很多人面临优化裁员,近期科技巨头英特尔裁员2万人,传统岗位不断缩减,因此转行AI势在必行!

这些资料有用吗?

这份资料由我们和鲁为民博士(北京清华大学学士和美国加州理工学院博士)共同整理,现任上海殷泊信息科技CEO,其创立的MoPaaS云平台获Forrester全球’强劲表现者’认证,服务航天科工、国家电网等1000+企业,以第一作者在IEEE Transactions发表论文50+篇,获NASA JPL火星探测系统强化学习专利等35项中美专利。本套AI大模型课程由清华大学-加州理工双料博士、吴文俊人工智能奖得主鲁为民教授领衔研发。

资料内容涵盖了从入门到进阶的各类视频教程和实战项目,无论你是小白还是有些技术基础的技术人员,这份资料都绝对能帮助你提升薪资待遇,转行大模型岗位。


大模型全套学习资料已整理打包,有需要的小伙伴可以微信扫描下方CSDN官方认证二维码,免费领取【保证100%免费】

需要专业的网站建设服务?

联系我们获取免费的网站建设咨询和方案报价,让我们帮助您实现业务目标

立即咨询