克孜勒苏柯尔克孜自治州网站建设_网站建设公司_数据统计_seo优化
2026/1/5 20:36:28 网站建设 项目流程

本文详解如何使用DeepSeek+RAGFlow构建私有知识库,解决网页版三大痛点:数据隐私、文件限制和维护困难。通过6步全流程实现本地部署,包括安装Ollama、拉取DeepSeek模型、配置Docker与RAGFlow等。提供常见问题解决方案和替代方案,帮助用户在完全离线环境中实现自然语言查询内部文档,适用于处理敏感数据的企业和个人用户。

【导语】:

这份 PDF 是一份“2026 年 1 月 1 日新鲜出炉”的实战笔记,作者“工厂仿真世界-龙老师”把过去 踩过的所有坑,浓缩成一份「DeepSeek + RAGFlow 构建个人/企业私有知识库」的完整通关攻略。

下面按“为什么要这么干 → 到底要干成什么样 → 具体怎么干 → 第二天开机怎么复现”四个层次,给你一次说透。

一、为什么要“脱网”折腾?——网页版 DeepSeek 解决不了的 3 个硬痛点

  1. 数据隐私

    网页版会把文件上传到官方服务器,敏感制度、标书、配方一旦出境就不可控。

  2. 文件数量/体积天花板

    网页版一次 3~5 个文件、单文件 10~20 MB 是常态,几百份 Word、PDF、PPT、Excel 直接传爆。

  3. 维护噩梦

    每次对话都要反复上传;想删改一篇制度,得把所有文件重新拖一遍,根本无法版本管理。

二、最终要干成什么样?——两个“开箱即看”的 Demo

Demo 1:制度问答

上传《蟹堡王员工规范》后,提问“怎么接待一车沙丁鱼”,系统直接给出 6 步 SOP,并标明出处页码。

Demo 2:技术手册问答

把 Plant Simulation 工厂仿真的相关文档拖进去Ragflow,问“介绍一下仿真和建模概念”,答案把“问题识别→模型构建→仿真求解→结果分析” 4 步法一次性总结,并注明引用章节。

三、技术路线 30 秒讲清

  1. 本地跑 DeepSeek(Chat 模型)→ 解决“大脑”

  2. 本地跑 RAGFlow(自带 Embedding+向量库)→ 解决“记忆”

  3. 两者通过 Ollama 的 REST API 对接 → 实现“开卷考试”式回答

    流程:用户提问 → Embedding 转向量 → 检索文本块 → 把文本块塞进 Prompt → DeepSeek 生成答案。

四、落地 6 步全流程(照抄就能跑)

步骤 0 机器准备

Win10/11 或 Ubuntu 22.04,16 GB 内存 + 50 GB 空余硬盘,BIOS 打开虚拟化。

步骤 1 装 Ollama

① 官网下载一键安装包 → ② 把OLLAMA\_HOST=0.0.0.0:11434写进系统环境变量 → ③ 重启电脑。

(目的:让 Docker 里的 RAGFlow 能访问宿主机上的模型。)

步骤 2 拉 DeepSeek 模型

ollama pull deepseek-r1:1.5b

备注: 用pull拉取或者run运行的命令都可以。

步骤 3 装 Docker-Desktop & 拉 RAGFlow 镜像

国内网络记得在 Docker Engine 里加镜像源;选择带 Embedding的版本。

步骤 4 调整 docker-compose.yml

把对外端口改成

- 8880:80

- 4443:443

防止和本地 80/443 冲突;保存后docker compose -f docker-compose.yml up -d

步骤 5 首次登录配置

浏览器访问https://localhost:8880→ 注册管理员账号 →

① “模型提供商”里新增 Ollama,BaseUrl 填http://宿主机IP:11434,模型选 deepseek-r1:1.5b → 显示“绿色更新成功”;

② “系统模型设置”把 Chat 模型设成刚添加的 deepseek,Embedding 用自带的text-embedding-v1

步骤 6 建库 → 上传 → 开聊

“知识库”→ 新建 → 拖入 PDF/Word/Excel → 选择General解析模板 → 等待切片完成 → “聊天”页新建助手 → 绑定知识库 → 开问。

五、常见 问题& 对应解决方案

  1. Docker 起不来

    报错Can't access Redis99% 是 Redis 容器没启动 → 把 Docker-Desktop 升级到最新,或手动docker start ragflow-redis

  2. 宿主机 IP 写错

    Win 用户Win+R → cmd → ipconfig拿 IPv4 地址,不要写127.0.0.1

  3. 11434 端口被防火墙拦截

    控制面板 → 高级设置 → 入站规则 → 新建 TCP 11434 允许。

  4. 第二天开机忘了启动顺序

口诀:

① 先起 Ollama(看右下角羊驼图标)→ ② 再起 Docker-Desktop → ③ 终端进docker\目录docker compose -f docker-compose.yml up -d→ ④ 浏览器localhost:8880登陆 → ⑤ 如果模型报红,把 Ollama 重启一次。

六、想更快?——“不本地部署大模型”方案

  1. 仍本地跑 RAGFlow(数据留在本机)。

  2. Chat 模型用官方在线 API(DeepSeek/Qianwen),Embedding 用 RAGFlow 自带。

七、 一些经验

  1. 版本:生产环境可以用非最新版本完整镜像,别追最新 tag。

  2. 端口规划:

    8880 → RAGFlow Web

    11434 → Ollama API

    5455 → MySQL

    6379 → Redis

    避免与现有 80/443 冲突。

【总结】:

“本地 DeepSeek 负责动脑,RAGFlow 负责翻书,Ollama 负责搭桥”,把这套组合拳打好,你就能在完全离线的环境里,用自然语言秒查任何内部制度、手册、实验报告。

如何学习AI大模型?

如果你对AI大模型入门感兴趣,那么你需要的话可以点击这里大模型重磅福利:入门进阶全套104G学习资源包免费分享!

这份完整版的大模型 AI 学习和面试资料已经上传CSDN,朋友们如果需要可以微信扫描下方CSDN官方认证二维码免费领取【保证100%免费】

这是一份大模型从零基础到进阶的学习路线大纲全览,小伙伴们记得点个收藏!


第一阶段:从大模型系统设计入手,讲解大模型的主要方法;

第二阶段:在通过大模型提示词工程从Prompts角度入手更好发挥模型的作用;

第三阶段:大模型平台应用开发借助阿里云PAI平台构建电商领域虚拟试衣系统;

第四阶段:大模型知识库应用开发以LangChain框架为例,构建物流行业咨询智能问答系统;

第五阶段:大模型微调开发借助以大健康、新零售、新媒体领域构建适合当前领域大模型;

第六阶段:以SD多模态大模型为主,搭建了文生图小程序案例;

第七阶段:以大模型平台应用与开发为主,通过星火大模型,文心大模型等成熟大模型构建大模型行业应用。

100套AI大模型商业化落地方案

大模型全套视频教程

200本大模型PDF书籍

👉学会后的收获:👈

• 基于大模型全栈工程实现(前端、后端、产品经理、设计、数据分析等),通过这门课可获得不同能力;

• 能够利用大模型解决相关实际项目需求: 大数据时代,越来越多的企业和机构需要处理海量数据,利用大模型技术可以更好地处理这些数据,提高数据分析和决策的准确性。因此,掌握大模型应用开发技能,可以让程序员更好地应对实际项目需求;

• 基于大模型和企业数据AI应用开发,实现大模型理论、掌握GPU算力、硬件、LangChain开发框架和项目实战技能, 学会Fine-tuning垂直训练大模型(数据准备、数据蒸馏、大模型部署)一站式掌握;

• 能够完成时下热门大模型垂直领域模型训练能力,提高程序员的编码能力: 大模型应用开发需要掌握机器学习算法、深度学习框架等技术,这些技术的掌握可以提高程序员的编码能力和分析能力,让程序员更加熟练地编写高质量的代码。

LLM面试题合集

大模型产品经理资源合集

大模型项目实战合集

👉获取方式:
😝有需要的小伙伴,可以保存图片到wx扫描二v码免费领取【保证100%免费】🆓

需要专业的网站建设服务?

联系我们获取免费的网站建设咨询和方案报价,让我们帮助您实现业务目标

立即咨询