神农架林区网站建设_网站建设公司_漏洞修复_seo优化
2025/12/23 14:58:12 网站建设 项目流程

生活的本质在于取舍,RAG架构亦是如此。

01 初识RAG

不知道大家在提问大模型的时候,有没有碰到过这种情况。

并不是每一个问题,它都能答上来。甚至有时候它会瞎编一些答案,一本正经地胡说八道。

这种情况,通常被称为大模型的幻觉。

因为大模型所有的认知,都是通过模型训练得来的。

恰巧你提的问题,在它的认知范围外,它就无法正确地回答你。

在早期,大模型遇到这种情况可能会分析得头头是道,但最终答非所问。但现在,它会实打实地回复它不知道。

比如用自己上线的网站:楼里,我让大模型介绍下,它明确回复不知道。

虽然比起之前的瞎编好上不少,但是它确实没解决实际的问题。

但是当我将网站的介绍文案和问题一起丢给大模型时,它的回复是这样的。

其实不难理解,无非就是把问题和网站介绍一起交给大模型。它会分析网站的介绍,然后结合提出的问题,找到用户想要的答案。

如果讲得专业一点,RAG就是将知识库与大模型结合的服务。能够快速从大量的信息中搜寻、分析、生成最终的答案,为用户提供精准的信息。

这种知识库体系可以被运用在企业内部,如建立企业内部文档、考勤制度或规范、数据、业务经验等等。建立好内部的知识体系,让大模型可以精确分析数据,借鉴大模型的能力,员工可快速查阅相关内容。

但是讲得不专业一些,就是先从你的知识库里查资料,再让大模型照着资料回答问题。


02 RAG架构

那么问题来了:怎么判断知识库中的一段文字和用户提出的问题有关联?

这就要引入一个新的概念:Embedding模型。

Embedding模型的输入也是一段文字,与大模型有所区别的是,它的输出是一组固定长度的数组。

简单的理解就是:预先把内容的文本有损压缩成一串数字坐标,用户提出的问题也会压缩成坐标。最终可以通过计算坐标之间的距离,来判断问题和内容是否相关。

现在输入几个问题:

1、七号楼是独立开发吗?

2、七号楼是开发者吗?

3、七号楼是程序员吗?

4、海报上的字体要大一些吗?

如果用人的思维非常简单就可以回答,前三个问题比较类似,并且答案是肯定的。最后一个问题跟前面的问题毫无关系,并且答案是否定的。

但是换成Embedding模型的角度,事情就变得复杂了,它只能按照既定的套路去解答问题。

从上面的描述可知,文本信息最终都会被压缩成坐标。由此我们画一个简单的二维坐标系来展示(真实的Embedding坐标系肯定不止二维,如OpenAI的text-embedding-3-small是1536个维度)

三条关于七号楼信息的内容在坐标系上距离非常贴近,一条关于海报信息的内容则距离非常远。

当用户提问:七号楼是独立开发吗?七号楼是开发者吗?七号楼是程序员吗?

这些问题最终也会被映射到这个坐标系上,并且很贴近坐标系的左上方,然后通过计算拿到与问题最贴近的一些答案,将问题和这些答案当做上下文,统一交给大模型去处理,最后生成用户想要的答案。

反之,用户提问:海报上的字体要大一些吗?

这个问题会去往坐标系的右下角,然后找到“海报上的字体要小一些”这样的答案,也一并交给大模型。

按照这样的流程,大模型最终会拿到和用户问题强关联的内容,经过一系列的分析,产生用户想要的答案。

由此,RAG架构总结如下,它包含:Embedding模型、向量检索(坐标系)、上下文构建、大模型生成答案。


03 切块和向量库

为了解释清楚RAG架构,上面所说的场景其实都是理想状态,真实情况要复杂很多。

回到最初的场景,楼里网站的介绍,其实文档是很长的。

如果将整个文档的内容只映射成一个坐标,那么文档和问题一起提交给大模型的时候,那产生的token... 不需要我多说了吧。

所以,就需要对整篇文档进行分段处理,批量向量化,专业词汇叫:Chunking,意思就是切块。

切块:顾名思义就是将文本内容进行分割。

做完文本切块后,还需要将每段的原始文本和每个向量坐标一一对应起来,这个对应关系需要被保存起来。

传统的数据库也能存对应关系,但是做不了向量检索。

于是专门为这类场景定制了向量数据库。它可以检索出离问题向量最近的一些向量数据。

常见的向量数据库有:Milvus、Qdrant、Pinecone、PostgreSQL+pgvector等等。

于是整个流程就可以丝滑地串起来了

但是,整个RAG还存在缺陷:比如整篇知识库内容怎么分块?按段落、按句子、还是按篇幅?如果内容一长,并且提出的问题比较复杂,貌似各种切块方式都不合适了。

不过我有一些不成熟的想法:是不是可以训练一个专门切块的大模型,或者直接让大模型参与分块。

额,好吧,还是继续等等,看看后续有没有合适的方案去解决这些问题。


04 总结

如果让事情回归生活,那么RAG的本质就是在做取舍。把与问题不相关的舍弃,留下相关的部分。

就像今年,我舍弃了奋斗十年的职场,转身独立开发。这就是主动选择想要的生活方式和想要专注的方向。

又或者微信通讯录中密密麻麻的好友,最终能打开聊天框的寥寥无几。有些聊天记录,还停留在那个搞笑的表情包,甚至是一句你好。

最后

我在一线科技企业深耕十二载,见证过太多因技术卡位而跃迁的案例。那些率先拥抱 AI 的同事,早已在效率与薪资上形成代际优势,我意识到有很多经验和知识值得分享给大家,也可以通过我们的能力和经验解答大家在大模型的学习中的很多困惑。

我整理出这套 AI 大模型突围资料包:

  • ✅AI大模型学习路线图
  • ✅Agent行业报告
  • ✅100集大模型视频教程
  • ✅大模型书籍PDF
  • ✅DeepSeek教程
  • ✅AI产品经理入门资料

如果你也想通过学大模型技术去帮助自己升职和加薪,可以扫描下方链接👇👇
​​

为什么我要说现在普通人就业/升职加薪的首选是AI大模型?

人工智能技术的爆发式增长,正以不可逆转之势重塑就业市场版图。从DeepSeek等国产大模型引发的科技圈热议,到全国两会关于AI产业发展的政策聚焦,再到招聘会上排起的长队,AI的热度已从技术领域渗透到就业市场的每一个角落。


智联招聘的最新数据给出了最直观的印证:2025年2月,AI领域求职人数同比增幅突破200%,远超其他行业平均水平;整个人工智能行业的求职增速达到33.4%,位居各行业榜首,其中人工智能工程师岗位的求职热度更是飙升69.6%。

AI产业的快速扩张,也让人才供需矛盾愈发突出。麦肯锡报告明确预测,到2030年中国AI专业人才需求将达600万人,人才缺口可能高达400万人,这一缺口不仅存在于核心技术领域,更蔓延至产业应用的各个环节。

​​

资料包有什么?

①从入门到精通的全套视频教程

包含提示词工程、RAG、Agent等技术点

② AI大模型学习路线图(还有视频解说)

全过程AI大模型学习路线

③学习电子书籍和技术文档

市面上的大模型书籍确实太多了,这些是我精选出来的

④各大厂大模型面试题目详解


⑤ 这些资料真的有用吗?

这份资料由我和鲁为民博士共同整理,鲁为民博士先后获得了北京清华大学学士和美国加州理工学院博士学位,在包括IEEE Transactions等学术期刊和诸多国际会议上发表了超过50篇学术论文、取得了多项美国和中国发明专利,同时还斩获了吴文俊人工智能科学技术奖。目前我正在和鲁博士共同进行人工智能的研究。

所有的视频教程由智泊AI老师录制,且资料与智泊AI共享,相互补充。这份学习大礼包应该算是现在最全面的大模型学习资料了。

资料内容涵盖了从入门到进阶的各类视频教程和实战项目,无论你是小白还是有些技术基础的,这份资料都绝对能帮助你提升薪资待遇,转行大模型岗位。


智泊AI始终秉持着“让每个人平等享受到优质教育资源”的育人理念‌,通过动态追踪大模型开发、数据标注伦理等前沿技术趋势‌,构建起"前沿课程+智能实训+精准就业"的高效培养体系。

课堂上不光教理论,还带着学员做了十多个真实项目。学员要亲自上手搞数据清洗、模型调优这些硬核操作,把课本知识变成真本事‌!

​​​​

如果说你是以下人群中的其中一类,都可以来智泊AI学习人工智能,找到高薪工作,一次小小的“投资”换来的是终身受益!

应届毕业生‌:无工作经验但想要系统学习AI大模型技术,期待通过实战项目掌握核心技术。

零基础转型‌:非技术背景但关注AI应用场景,计划通过低代码工具实现“AI+行业”跨界‌。

业务赋能 ‌突破瓶颈:传统开发者(Java/前端等)学习Transformer架构与LangChain框架,向AI全栈工程师转型‌。

👉获取方式:

😝有需要的小伙伴,可以保存图片到wx扫描二v码免费领取【保证100%免费】🆓

需要专业的网站建设服务?

联系我们获取免费的网站建设咨询和方案报价,让我们帮助您实现业务目标

立即咨询