本文详细介绍如何使用AnythingLLM和DeepSeek R1搭建个人AI知识库,解决AI回答不准确的痛点。从下载安装、配置API、上传文档到知识检索问答,提供完整步骤指导。该方法简单高效、成本低廉,可创建可靠安全的私有知识库,大幅提升学习和工作效率,特别适合新手用户。
各位朋友,是不是经常被 AI 气得火冒三丈,恨不得把键盘给砸了?你让它查公司去年的财务数据,它却开始背诵经济学原理;你让它分析竞品的策略,它却大谈特谈马斯洛需求理论。我太能理解这种感受了,这就好比你花钱雇了个助理,结果这助理啥都不会,只会照搬百度百科的内容!
不过,今天我要给大家分享一个超实用的技巧:利用 DeepSeek 创建专属的 AI 知识库!我自己已经开始使用这个方法了,效果简直出乎意料地好。它不仅让 AI 变得超可靠,还从根本上消除了商业机密泄露的风险。
其实,在 AI 出现之前,私有知识库就已经在很多场景中发挥了巨大作用,比如企业内部知识管理、个人知识储备等。而当它与出色的 DeepSeek 相结合后,知识检索和归纳的效率简直提升到了一个新的高度。
小白快速搭建个人 AI 知识库
个人 AI 知识库的方案多种多样,今天我来介绍一种既简单又高效的方法,特别适合新手。这种方法结合了 AnythingLLM 和 DeepSeek R1,不仅操作简单,而且知识检索效果出色。
工具简介
- AnythingLLM:这是一个知识库管理的前端工具,提供从上传知识、向量化数据到检索增强生成(RAG)的全流程服务。它完全开源且免费,非常适合个人用户。
- DeepSeek R1:这是幻方量化推出的大模型,性能与 Claude 3.5 相当,但 Token 成本极低。在本次方案中,我们将使用 DeepSeek R1 作为推理模型。
注意事项
- 模型选择:虽然我们推荐使用 DeepSeek R1,但 AnythingLLM 也支持其他推理模型,如 GPT、Claude,或者通过 Ollama 运行本地开源模型等。你可以根据自己的需求选择合适的模型。
通过这种组合,你可以轻松搭建一个高效、低成本的个人 AI 知识库,无论是学习、工作还是研究,都能大大提高你的效率。希望这个方案对你有所帮助!
安装 AnythingLLM
下载 AnythingLLM
地址:https://anythingllm.com/
AnythingLLM 是一个开源且免费的工具,采用 MIT 许可证,支持文本和多模态大语言模型(LLM)在同一界面中使用。它能够轻松处理图像和音频。
该工具也适合用作强大的 API,便于任何自定义开发或现有产品的功能扩展。AnythingLLM 拥有不断增长的插件和集成生态系统,可以增强其在应用和组织中的功能。
设计上,AnythingLLM 默认是私密的,所有数据都存储并在运行该工具的本地机器上处理。用户可以轻松下载并运行 LLM,无需额外的设置或程序。
AnythingLLM Desktop 并不是 SaaS 服务,用户无需注册即可在本地使用完整的工具套件。
此外,AnythingLLM 可以根据公司的品牌进行白标定制,并支持多个用户在同一服务器上使用,确保用户之间的完全隔离。管理员可以细致控制用户的权限和可见内容。
支持系统:Windows、Mac、Linux
配置 AI 大脑(如何使用 DeepSeekAPI 或者本地搭建 DeepSeek)
设置你的 AI 助手:DeepSeek
打开软件后,首先需要配置 LLM(大型语言模型)。这里推荐选择 DeepSeek 作为你的模型,具体选择“chat”选项,这是目前最新的模型版本。为了使用 DeepSeek 的服务,你需要一个 API Key。你可以通过访问 DeepSeek 的官网
https://platform.deepseek.com
注册账号并获取 API Key。注册过程简单,充值少量费用(几块钱)即可开始使用,非常经济实惠。
您可能会遇到这样的提示:“目前我们正在进行网站的维护与升级工作,网站暂时无法正常使用。我们正在全力推进相关工作,争取尽快恢复服务。感谢您在此期间的理解与耐心等待。”
如果官网的 API 暂时无法使用,您可以考虑使用本地部署版本的 DeepSeek。关于如何进行本地部署,可以参考文档,
本地部署 DeepSeek:打造你的专属 AI 推理环境,简单明了适合新手
进入工作区
可以在左下角设置按钮中进行基础配置,如:LLM、嵌入模型、向量数据库选择等,新手可以先保持默认设置。
(这里单独提下 Embedding 模型,Embedding 是将高纬度数据嵌入低纬度空间方便存储,模型性能影响对后续知识
检索有挺大影响,建议可以换成 bge-m3,这个模型对多语言和长文本都支持的不错,需要本地运行 0llama 加载这
个模,由于需要安装 0llama,新手可以跳过这一步)
上传文档
- 点击工作空间的上传按钮,
- 支持上传 PDF、CSV、音频或者抓取网页内容等等。上传后右键加入工作空间就 ok 了。
一定要点击 save 按钮,不然不会生效。
- 可以在 Data Connnector 中获取 youtube(需要有 cc 字幕)视频、confluence 文档库等内容平台的数据。
知识检索问答
- 工作区点击 new thread 可以开启新的对话,然后提问就 ok 了
- 果想判断 LLM 回答的知识范围,可以在回答的底部点开:Show Citations 就能看到引用了哪些知识
AnythingLLM 是一个很强大的知识库管理工具,新版本还提供了 Agent 模式,可以接入谷歌、bing 等搜索引擎,实现实时搜索增加检索的时效性。
如何系统的学习大模型 AI ?
由于新岗位的生产效率,要优于被取代岗位的生产效率,所以实际上整个社会的生产效率是提升的。
但是具体到个人,只能说是:
“最先掌握AI的人,将会比较晚掌握AI的人有竞争优势”。
这句话,放在计算机、互联网、移动互联网的开局时期,都是一样的道理。
我在一线互联网企业工作十余年里,指导过不少同行后辈。帮助很多人得到了学习和成长。
我意识到有很多经验和知识值得分享给大家,也可以通过我们的能力和经验解答大家在人工智能学习中的很多困惑,所以在工作繁忙的情况下还是坚持各种整理和分享。但苦于知识传播途径有限,很多互联网行业朋友无法获得正确的资料得到学习提升,故此将并将重要的AI大模型资料包括AI大模型入门学习思维导图、精品AI大模型学习书籍手册、视频教程、实战学习等录播视频免费分享出来。
一直在更新,更多的大模型学习和面试资料已经上传带到CSDN的官方了,有需要的朋友可以扫描下方二维码免费领取【保证100%免费】👇👇
01.大模型风口已至:月薪30K+的AI岗正在批量诞生
2025年大模型应用呈现爆发式增长,根据工信部最新数据:
国内大模型相关岗位缺口达47万
初级工程师平均薪资28K(数据来源:BOSS直聘报告)
70%企业存在"能用模型不会调优"的痛点
真实案例:某二本机械专业学员,通过4个月系统学习,成功拿到某AI医疗公司大模型优化岗offer,薪资直接翻3倍!
02.大模型 AI 学习和面试资料
1️⃣ 提示词工程:把ChatGPT从玩具变成生产工具
2️⃣ RAG系统:让大模型精准输出行业知识
3️⃣ 智能体开发:用AutoGPT打造24小时数字员工
📦熬了三个大夜整理的《AI进化工具包》送你:
✔️ 大厂内部LLM落地手册(含58个真实案例)
✔️ 提示词设计模板库(覆盖12大应用场景)
✔️ 私藏学习路径图(0基础到项目实战仅需90天)
第一阶段(10天):初阶应用
该阶段让大家对大模型 AI有一个最前沿的认识,对大模型 AI 的理解超过 95% 的人,可以在相关讨论时发表高级、不跟风、又接地气的见解,别人只会和 AI 聊天,而你能调教 AI,并能用代码将大模型和业务衔接。
- 大模型 AI 能干什么?
- 大模型是怎样获得「智能」的?
- 用好 AI 的核心心法
- 大模型应用业务架构
- 大模型应用技术架构
- 代码示例:向 GPT-3.5 灌入新知识
- 提示工程的意义和核心思想
- Prompt 典型构成
- 指令调优方法论
- 思维链和思维树
- Prompt 攻击和防范
- …
第二阶段(30天):高阶应用
该阶段我们正式进入大模型 AI 进阶实战学习,学会构造私有知识库,扩展 AI 的能力。快速开发一个完整的基于 agent 对话机器人。掌握功能最强的大模型开发框架,抓住最新的技术进展,适合 Python 和 JavaScript 程序员。
- 为什么要做 RAG
- 搭建一个简单的 ChatPDF
- 检索的基础概念
- 什么是向量表示(Embeddings)
- 向量数据库与向量检索
- 基于向量检索的 RAG
- 搭建 RAG 系统的扩展知识
- 混合检索与 RAG-Fusion 简介
- 向量模型本地部署
- …
第三阶段(30天):模型训练
恭喜你,如果学到这里,你基本可以找到一份大模型 AI相关的工作,自己也能训练 GPT 了!通过微调,训练自己的垂直大模型,能独立训练开源多模态大模型,掌握更多技术方案。
到此为止,大概2个月的时间。你已经成为了一名“AI小子”。那么你还想往下探索吗?
- 为什么要做 RAG
- 什么是模型
- 什么是模型训练
- 求解器 & 损失函数简介
- 小实验2:手写一个简单的神经网络并训练它
- 什么是训练/预训练/微调/轻量化微调
- Transformer结构简介
- 轻量化微调
- 实验数据集的构建
- …
第四阶段(20天):商业闭环
对全球大模型从性能、吞吐量、成本等方面有一定的认知,可以在云端和本地等多种环境下部署大模型,找到适合自己的项目/创业方向,做一名被 AI 武装的产品经理。
- 硬件选型
- 带你了解全球大模型
- 使用国产大模型服务
- 搭建 OpenAI 代理
- 热身:基于阿里云 PAI 部署 Stable Diffusion
- 在本地计算机运行大模型
- 大模型的私有化部署
- 基于 vLLM 部署大模型
- 案例:如何优雅地在阿里云私有部署开源大模型
- 部署一套开源 LLM 项目
- 内容安全
- 互联网信息服务算法备案
- …
学习是一个过程,只要学习就会有挑战。天道酬勤,你越努力,就会成为越优秀的自己。
如果你能在15天内完成所有的任务,那你堪称天才。然而,如果你能完成 60-70% 的内容,你就已经开始具备成为一名大模型 AI 的正确特征了。