玉溪市网站建设_网站建设公司_图标设计_seo优化-潮州市网站建设公司

作为一名深耕后端领域十余年的研发人员，我踏入AI赛道已有两年光景。从最初的Chat QA场景搭建，到AI Agent开发、Multi-Agent协同，再到AI-Native架构的深度探索，每一步都踩着大模型技术迭代的浪潮前行。

今年第二季度，我们团队正式将AI技术与保险核心业务深度绑定，开启全面落地征程。目前，自研的AI Agent已顺利跨越L1级Chatbot基础交互阶段，在L2级Reasoner逻辑推理层面实现能力爆发，能够处理保险条款解读、理赔核查等复杂业务场景。

谈及AI浪潮下的研发心态，焦虑是绕不开的话题。大模型技术的更新速度实在迅猛，尤其是Cursor、JoyCode等智能开发工具普及后，不仅后端研发，所有业务研发人员都面临转型压力——曾经内卷的微服务、微前端架构已不是风口核心，AI成为行业新的竞争焦点。这种焦虑并非后端专属，模型开发领域同样如此，单一Agent架构早已退出主流舞台。

而我对抗焦虑的核心解法，是将后端深耕多年的微服务架构思想迁移至AI领域：把Agent、Planning、RAG、Evaluation、MCP、LLM、Prompt、Memory、MultiModal等核心模块拆解为独立服务，通过标准化接口实现协同联动，构建可扩展、高可用的AI技术体系。

其中，RAG（检索增强生成）作为解决保险业务知识密集型需求的核心技术，我们的自研产品“保险Eva”已完成三轮架构迭代，从基础RAG逐步升级至DeepSearch增强版，最终落地融合Graph RAG、DeepSearch与持续反思验证机制的混合式检索架构，这也是本文要重点拆解的内容。

后端研发的 AI 突围

作为一名后端研发，开始AI之路已经2年，从Chat QA，到AI Agent的开发，在到Multi-Agent，AI-Native。

今年Q2开始结合保险业务场景，开始全面AI落地。我们的AI Agent的能力已跨过L1（Chatbot），在L2（Reasoner）全面爆发。

我内心是焦虑的，大模型发展的得太快，尤其是在Cursor、JoyCode等产品出来后。我想不止是后端研发，所有的业务研发都会焦虑，因为现在风口不在卷微服务、微前端的架构，全都开始卷AI了。除了AI Infra外，模型开发也一样焦虑吧，单一的Agent也已是过去式。

我的解药是把微服务架构应用到AI上，什么Agent、Planning、RAG、Evaluation、MCP、LLM、Prompt、Memory、MultiModal都安排起来。

保险Eva的RAG架构经历了三个阶段，从基础RAG到Deepsearch，在到混合式检索架构（Graph RAG + DeepSearch**+**持续的反思与验证)

RAG架构

历史：

首先我们回顾下什么是RAG？RAG（Retrieval-Augmented Generation - 检索增强生成）是一种构建基于大模型（LLM）应用的创新技术，通过利用外部知识源为LLM提供相关上下文，从而减少幻觉现象，提高生成内容的准确性和可靠性。最早要追溯到2020年，是由Facebook AI Research（Meta AI）提出的论文《Retrieval-Augmented Generation for Knowledge-Intensive NLP Tasks》

基础 RAG 架构，朴素的知识管理员

基础 RAG 是所有RAG范式的基础，包括DeepResearch、Agentic RAG、Graph RAG都是在基础RAG上进化出来的。所以我们先熟悉下基础RAG的架构，它包含两个核心组件：生成组件（ETL Pipeline）和检索组件（Retrieval）引入下图为例：

①，②，③，④步骤都是生成组件，它的核心就是文件**提取、转换、加载，**我们来一步步分析。

•文件提取（Extract）：核心文件读取器，常用的有doc、pdf、excel、图片等文件，需要关注对中文支持和Execl单元格的处理。

•文件转换（Transform）：文件转换的核心有两个chunk和embedding。

chunk阶段尤为关键是所有RAG范式的核心，就像切蛋糕一样，切之前就已分配好**：**

常用的分块策略有五种：固定大小分块，语义分块、递归分块，基于文档结构分块，基于大模型分块。

embedding：向量化，向量是为了满足相似性查找的需求，比如表达“今天天气如何？”这类的询问方式有很多，这时我们需要将文本向量化，存入到向量库中：

数据加载（Load）**：**数据存储，我们用的Elasticsearch8+（ES）进行混合存储，当然也可以其他向量库和关系型数据库来存储。

⑦，③，④，⑤，⑥步骤是检索组件，它分为预处理、检索、后处理

预处理核心是Query：要不要做Query的扩充？扩充多少？带不带原始Query？需不需要对Query转译？预处理偏向于业务处理，根据需求来，相当于基础RAG的一扩展特性，Agentic RAG范式沿用了这一特性。

检索的核心是算法：基础的检索算法“稀疏算法和稠密算法”

稀疏算法可以利用LLM提取关键词，embedding维度设为整个表中所有的关键词的维度，维度上的值是关键词在当前文本块中的TF-IDF值。当用户查询时，系统会将其转化为一个类似的TF-IDF向量，通过计算用户查询向量和所有文本块向量之间的cosine，找到得分最高或最相似的向量块。	稠密算法常用的是BM25，用户输入查询时，系统会使用LLM将查询转化为一个embedding向量，然后在向量数据库中进行cosine计算，找到最相似的向量块。

第③步中用相同的嵌入文本块模型，向量化用户的查询

然后，将向量化的查询与数据库中现有的向量进行比较，以找到最相似的信息。常规的向量检索ANN算法，我们还支kNN算法，向量库的表结构的基础字段索引，向量块，原始文本块，原数据字段。

TopK，通过预设的k阈值，我们只获取最相似的k条原始文本块返回，这是rank的流程。

后处理的核心是排序：在精排（Rerank）也就是二段检索，之后会进行文本拼接，把结果拼接到上下文中生成Prompt，最后由LLM生成最终答案（Generate）。

Rerank不是一个必选项，Rerank模型会结合查询对检索到的初始文本块列表进行评估，为每个文本块分配一个相关性分数。这一过程会重新排序。

最后一步是生成结果，将原始的查询和检索到的文本块，拼接到Prompt中，由大模型生成最终的结果。

倒退到2022年，基础的RAG方案是很OK的。随之模型发展到现在的Agentic Agent，需要解决的往往是对复杂问题的深度检索，基础的RAG这时显得非常的无力，但也促使RAG演进了新的范式：Graph RAG，Agentic RAG，DeepResearch

我们的RAG架构

我们的RAG产品架构上包含了“保险知识库+记忆库+文件库+智能体+搜索+测评”，是技术驱动由算法，工程，数据一起完成的。

算法AgenticRAG：我们学习了通义DeepResearch的开源WebWeaver架构，微软的开源GraphRAG，结合现在火热的ZEP、REFRAG的论文

架构上实现了混合式检索“Agentic RAG+DeepResearch”，记忆实现了“情景记忆+程序记忆+语义记忆+时间记忆”，RAG智能体矩阵实现了“RAG查询增强智能体，规划师智能体，工具选择器智能体，反思和验证智能体，基于图结构的智能体，深度研究型智能体”。

记忆设计：语义记忆图谱，程序记忆图谱，情景记忆图谱

工程RAG平台：承上启下串联全流程，承接业务Agent的检索、查询的需求，提供标准接口让Agent专注于模型训练迭代

工程架构分了四层：智能体层，业务逻辑层，检索层，数据层；技术栈：Spring AI ，Elasticsearch8+，Neo4j，Redis，京东云；技术能力支持上支持Python Code和RAG Agent Workflow。

数据架构：保险知识库+记忆库+任务中心组成三角矩阵

保险知识库架构：

任务中心：

Chunck：学习Cognee参数调优的思想，提供了五种chunk策略。

记忆库：“语义记忆图谱，程序记忆图谱，情景记忆图谱”在此三类记忆上增加双时间字段，保证记忆的时效性。

为什么这样设计？

我们团队核心是一套由多智能体驱动业务的平台（Eva）。

•我们是需要RAG是因为保险业务，保司的很多数据是网上没有的，并且内容很多，上百页甚至大几百页的文档比比皆是。

•我们是ToB业务，是围绕业务发展的Agent，直面经营结果(规模/利润)。

•我们的RAG平台隶属于Eva基础能力之一。

未来的RAG

不再过多揣测未来，乘风破浪即可。

•Agentic RAG里面包含了Deepsearch，Graph RAG，基础RAG，如果感兴趣我会像基础RAG一样，一层层剥开和大家交流。

•Python Code和RAG Agent Workflow是工程端的自研核心，如果感兴趣我会像基础RAG一样，一层层剥开和大家交流。

•记忆库除了“语义记忆图谱，程序记忆图谱，情景记忆图谱”我们还在研发时间记忆图谱，如果感兴趣我会像基础RAG一样，一层层剥开和大家交流。

•Chunck绝对是核心，以至于让Cognee花了大半年时间在参数调优上，我们总结一份配置手册，如果感兴趣我会像基础RAG一样，一层层剥开和大家交流。

最后

近期科技圈传来重磅消息：行业巨头英特尔宣布大规模裁员2万人，传统技术岗位持续萎缩的同时，另一番景象却在AI领域上演——AI相关技术岗正开启“疯狂扩招”模式！据行业招聘数据显示，具备3-5年大模型相关经验的开发者，在大厂就能拿到50K×20薪的高薪待遇，薪资差距肉眼可见！

业内资深HR预判：不出1年，“具备AI项目实战经验”将正式成为技术岗投递的硬性门槛。在行业迭代加速的当下，“温水煮青蛙”式的等待只会让自己逐渐被淘汰，与其被动应对，不如主动出击，抢先掌握AI大模型核心原理+落地应用技术+项目实操经验，借行业风口实现职业翻盘！

深知技术人入门大模型时容易走弯路，我特意整理了一套全网最全最细的大模型零基础学习礼包，涵盖入门思维导图、经典书籍手册、从入门到进阶的实战视频、可直接运行的项目源码等核心内容。这份资料无需付费，免费分享给所有想入局AI大模型的朋友！

👇👇扫码免费领取全部内容👇👇

部分资料展示

1、 AI大模型学习路线图

2、全套AI大模型应用开发视频教程

从入门到进阶这里都有，跟着老师学习事半功倍。

3、大模型学习书籍&文档

4、AI大模型最新行业报告

2025最新行业报告，针对不同行业的现状、趋势、问题、机会等进行系统地调研和评估，以了解哪些行业更适合引入大模型的技术和应用，以及在哪些方面可以发挥大模型的优势。

5、大模型大厂面试真题

整理了百度、阿里、字节等企业近三年的AI大模型岗位面试题，涵盖基础理论、技术实操、项目经验等维度，每道题都配有详细解析和答题思路，帮你针对性提升面试竞争力。

6、大模型项目实战&配套源码

学以致用，在项目实战中检验和巩固你所学到的知识，同时为你找工作就业和职业发展打下坚实的基础。

👉学会后的收获：👈

• 基于大模型全栈工程实现（前端、后端、产品经理、设计、数据分析等），通过这门课可获得不同能力；

• 能够利用大模型解决相关实际项目需求：大数据时代，越来越多的企业和机构需要处理海量数据，利用大模型技术可以更好地处理这些数据，提高数据分析和决策的准确性。因此，掌握大模型应用开发技能，可以让程序员更好地应对实际项目需求；

• 基于大模型和企业数据AI应用开发，实现大模型理论、掌握GPU算力、硬件、LangChain开发框架和项目实战技能，学会Fine-tuning垂直训练大模型（数据准备、数据蒸馏、大模型部署）一站式掌握；

• 能够完成时下热门大模型垂直领域模型训练能力，提高程序员的编码能力：大模型应用开发需要掌握机器学习算法、深度学习框架等技术，这些技术的掌握可以提高程序员的编码能力和分析能力，让程序员更加熟练地编写高质量的代码。

👇👇扫码免费领取全部内容👇👇

这些资料真的有用吗？

这份资料由我和鲁为民博士(北京清华大学学士和美国加州理工学院博士)共同整理，现任上海殷泊信息科技CEO，其创立的MoPaaS云平台获Forrester全球’强劲表现者’认证，服务航天科工、国家电网等1000+企业，以第一作者在IEEE Transactions发表论文50+篇，获NASA JPL火星探测系统强化学习专利等35项中美专利。本套AI大模型课程由清华大学-加州理工双料博士、吴文俊人工智能奖得主鲁为民教授领衔研发。

资料内容涵盖了从入门到进阶的各类视频教程和实战项目，无论你是小白还是有些技术基础的技术人员，这份资料都绝对能帮助你提升薪资待遇，转行大模型岗位。

这份完整版的大模型 AI 学习资料已经上传CSDN，朋友们如果需要可以微信扫描下方CSDN官方认证二维码免费领取【保证100%免费】

玉溪市网站建设_网站建设公司_图标设计_seo优化

后端研发的 AI 突围

RAG架构

历史：

基础 RAG 架构，朴素的知识管理员

我们的RAG架构

数据架构：保险知识库+记忆库+任务中心组成三角矩阵

未来的RAG

最后

部分资料展示

1、 AI大模型学习路线图

2、全套AI大模型应用开发视频教程

3、大模型学习书籍&文档

4、AI大模型最新行业报告

5、大模型大厂面试真题

6、大模型项目实战&配套源码

👉学会后的收获：👈

这些资料真的有用吗？

热门文章

文章分类

标签云

需要专业的网站建设服务？

玉溪市网站建设_网站建设公司_图标设计_seo优化

后端研发的 AI 突围

RAG架构

历史：

基础 RAG 架构，朴素的知识管理员

我们的RAG架构

数据架构：保险知识库+记忆库+任务中心 组成三角矩阵

未来的RAG

最后

部分资料展示

1、 AI大模型学习路线图

2、 全套AI大模型应用开发视频教程

3、 大模型学习书籍&文档

4、AI大模型最新行业报告

5、大模型大厂面试真题

6、大模型项目实战&配套源码

👉学会后的收获：👈

这些资料真的有用吗？

热门文章

文章分类

标签云

相关文章

#智慧景区#多场景管理系统，一体系，多场景，全赋能

python基于django的的餐厅点餐管理系统设计与实现

python基于django的网上书店的图书销售商城

需要专业的网站建设服务？

数据架构：保险知识库+记忆库+任务中心组成三角矩阵

2、全套AI大模型应用开发视频教程

3、大模型学习书籍&文档