分享一套锋哥原创的的AI大模型 - 基于LangChain的RAG中医临床智能诊疗问答系统(Flask+Vue3+Ollama+Chroma)

张开发

• 2026/4/3 19:42:24 • 15 分钟阅读

分享文章

分享一套锋哥原创的的AI大模型 - 基于LangChain的RAG中医临床智能诊疗问答系统(Flask+Vue3+Ollama+Chroma)

大家好我是锋哥分享一套锋哥原创的AI大模型-基于LangChain的RAG中医临床智能诊疗问答系统(FlaskVue3OllamaChroma)分享下哈。项目介绍本系统采用前后端分离的B/S架构前端使用Vue3框架结合Element Plus组件库构建用户界面后端采用Python Flask框架提供RESTful API服务。系统核心采用LangChain框架集成Ollama大语言模型和ChromaDB向量数据库实现了基于RAG技术的智能问答功能。系统主要包括用户管理、知识库管理、文档管理与向量化、智能问答、对话历史记录和数据统计可视化等功能模块。在系统实现过程中本文详细阐述了文档解析与文本分块、向量化存储与语义检索、RAG问答链构建等关键技术的实现方案。通过将中医临床文献进行向量化处理并存入ChromaDB系统能够根据用户的自然语言提问进行语义级别的相似度检索检索到最相关的文档片段后结合大语言模型生成准确、专业的诊疗建议。系统还实现了JWT身份认证、角色权限控制、数据可视化等功能具备良好的安全性和易用性。经测试验证系统各项功能运行稳定问答结果准确可靠能够有效辅助中医临床诊疗决策具有较好的应用价值和推广前景。源码下载链接https://pan.baidu.com/s/1wG6YPxJymmrZhhPonF0qEA?pwd1234提取码1234系统展示核心代码文档向量化服务负责文档解析、文本分块和Chroma向量存储 import os import time from flask import current_app from ollama import Client as OllamaClient, ResponseError from langchain_text_splitters import RecursiveCharacterTextSplitter from langchain_ollama import OllamaEmbeddings from langchain_chroma import Chroma class OllamaServiceError(Exception): Ollama服务相关异常用于提供更清晰的错误提示 pass class VectorService: 文档向量化服务类 def __init__(self): 初始化嵌入模型和文本分割器 self.embeddings OllamaEmbeddings( modelcurrent_app.config[OLLAMA_EMBED_MODEL], base_urlcurrent_app.config[OLLAMA_BASE_URL] ) self.text_splitter RecursiveCharacterTextSplitter( chunk_sizecurrent_app.config[CHUNK_SIZE], chunk_overlapcurrent_app.config[CHUNK_OVERLAP], length_functionlen ) self.persist_dir current_app.config[CHROMA_PERSIST_DIR] self.batch_size current_app.config.get(EMBED_BATCH_SIZE, 10) self.max_retries current_app.config.get(EMBED_MAX_RETRIES, 3) def _check_ollama(self): 预检查Ollama服务可用性和嵌入模型是否就绪。仅在服务未启动和模型未安装时硬拦截 5xx等瞬时错误只记录警告让后续重试机制处理。 :raises OllamaServiceError: 服务不可达或模型未安装时抛出 base_url current_app.config[OLLAMA_BASE_URL] model_name current_app.config[OLLAMA_EMBED_MODEL] client OllamaClient(hostbase_url) try: model_list client.list() except ConnectionError: raise OllamaServiceError( f无法连接Ollama服务({base_url})请确认Ollama已启动 ) except ResponseError as e: current_app.logger.warning( fOllama预检查返回异常(status {e.status_code})将继续尝试向量化: {e} ) return except Exception as e: current_app.logger.warning(fOllama预检查失败将继续尝试向量化: {e}) return installed {m.get(name, ) for m in model_list.get(models, [])} if not any(model_name in name or name in model_name for name in installed): raise OllamaServiceError( f嵌入模型 {model_name} 未安装请先执行: ollama pull {model_name} ) def _get_collection_name(self, kb_id): 根据知识库ID生成Chroma集合名称每个知识库使用独立的collection进行隔离 return fkb_{kb_id} def _load_file(self, file_path, file_type): 根据文件类型加载文档内容 :param file_path: 文件路径 :param file_type: 文件类型txt/pdf/md/docx :return: 文本内容 text if file_type in (txt, md): with open(file_path, r, encodingutf-8, errorsignore) as f: text f.read() elif file_type pdf: from pypdf import PdfReader reader PdfReader(file_path) for page in reader.pages: page_text page.extract_text() if page_text: text page_text \n elif file_type docx: from docx import Document as DocxDocument doc DocxDocument(file_path) for para in doc.paragraphs: if para.text.strip(): text para.text \n return text def _add_texts_with_retry(self, vectorstore, texts, metadatas, ids): 带重试的向量写入处理Ollama瞬时故障(502/503/504等) :param vectorstore: Chroma向量库实例 :param texts: 文本分块列表 :param metadatas: 元数据列表 :param ids: ID列表 last_error None for attempt in range(self.max_retries): try: vectorstore.add_texts(textstexts, metadatasmetadatas, idsids) return except Exception as e: last_error e err_msg str(e) is_retryable any(code in err_msg for code in (502, 503, 504)) if not is_retryable or attempt self.max_retries - 1: raise wait 2 ** attempt current_app.logger.warning( fOllama嵌入请求失败(第{attempt 1}次){wait}秒后重试: {err_msg} ) time.sleep(wait) raise last_error def process_document(self, doc_id, file_path, file_type, kb_id): 处理文档预检查 - 解析文件 - 文本分块 - 分批存入向量库 :param doc_id: 文档ID :param file_path: 文件路径 :param file_type: 文件类型 :param kb_id: 知识库ID :return: 分块数量 self._check_ollama() text self._load_file(file_path, file_type) if not text.strip(): raise ValueError(文档内容为空无法进行向量化) chunks self.text_splitter.split_text(text) if not chunks: raise ValueError(文档分块失败) file_name os.path.basename(file_path) metadatas [{doc_id: doc_id, file_name: file_name, chunk_index: i} for i in range(len(chunks))] ids [fdoc_{doc_id}_chunk_{i} for i in range(len(chunks))] collection_name self._get_collection_name(kb_id) vectorstore Chroma( collection_namecollection_name, embedding_functionself.embeddings, persist_directoryself.persist_dir ) # 分批写入降低单次Ollama嵌入请求的压力 for i in range(0, len(chunks), self.batch_size): batch_end min(i self.batch_size, len(chunks)) self._add_texts_with_retry( vectorstore, textschunks[i:batch_end], metadatasmetadatas[i:batch_end], idsids[i:batch_end], ) return len(chunks) def delete_document(self, doc_id, kb_id): 从向量库中删除指定文档的所有分块 :param doc_id: 文档ID :param kb_id: 知识库ID collection_name self._get_collection_name(kb_id) vectorstore Chroma( collection_namecollection_name, embedding_functionself.embeddings, persist_directoryself.persist_dir ) # 根据文档ID过滤并删除 vectorstore._collection.delete(where{doc_id: doc_id}) def get_retriever(self, kb_id): 获取指定知识库的检索器 :param kb_id: 知识库ID :return: Chroma检索器 collection_name self._get_collection_name(kb_id) vectorstore Chroma( collection_namecollection_name, embedding_functionself.embeddings, persist_directoryself.persist_dir ) return vectorstore.as_retriever( search_kwargs{k: current_app.config[RETRIEVER_TOP_K]} )

分享一套锋哥原创的的AI大模型 - 基于LangChain的RAG中医临床智能诊疗问答系统(Flask+Vue3+Ollama+Chroma)

最新文章

关于SSL证书签发时长调整通知

Rate_Limit限流

[AI应用框架/Java] Spring AI 应用开发指南＜＞概述、快速入门

C++ 笔记：std::bind 函数模板详解

【数据结构与算法】第24篇：哈夫曼树与哈夫曼编码

本地LLM部署工具（写给小白的LLM工具选型系列：第一篇）

推荐文章

相关文章

探索Akagi：实时牌局分析与AI决策支持的麻将辅助系统

SEO 视频在不同行业的应用有何差异_SEO 视频的长度应该控制在什么范围内

基于YOLO+DeepSeek的农作物病虫害检测与环境监测一体化智能平台植物病虫害识别系统

生成式引擎优化（GEO）实战指南：从技术架构到行业落地

嵌入式开发调试宏与性能优化实战

LosslessCut：解锁无损视频编辑的5个专业技巧

分享文章

更多文章

Muon实战：如何构建和部署生产级桌面应用

2026届最火的五大降AI率网站实际效果

Claude Sonnet 4.5新发现：模型情绪表征改写AI安全规则

一文入门Python语言：详解Python命名规则

PromptSource与自动提示生成：结合GPT创建高质量模板的方法

Kimi-VL-A3B-Thinking实战教程：Chainlit中集成历史对话与文件上传功能

Python数据标准化全攻略：从原理到实践

ollama+QwQ-32B应用场景：IT运维日志分析与故障根因推理

【Hot 100 刷题计划】 LeetCode 438. 找到字符串中所有字母异位词 | C++ 滑动窗口题解

PyInstxtractor：Python可执行文件解析工具的创新实践指南

CAN DBC 生成 C 代码工具：量产项目验证的高效解决方案

零基础学基于Linux的NPU固件开发专栏--5.1.3 示波器/逻辑分析仪：抓NPU时钟、数据信号（硬件调试入门

分享一套锋哥原创的的AI大模型 - 基于LangChain的RAG中医临床智能诊疗问答系统(Flask+Vue3+Ollama+Chroma)

最新文章

关于SSL证书签发时长调整通知

Rate_Limit限流

[AI应用框架/Java] Spring AI 应用开发指南＜＞概述、快速入门

C++ 笔记：std::bind 函数模板详解

【数据结构与算法】第24篇：哈夫曼树与哈夫曼编码

本地LLM部署工具（写给小白的LLM工具选型系列：第一篇）

推荐文章

相关文章

探索Akagi：实时牌局分析与AI决策支持的麻将辅助系统

SEO 视频在不同行业的应用有何差异_SEO 视频的长度应该控制在什么范围内

基于YOLO+DeepSeek的农作物病虫害检测与环境监测一体化智能平台 植物病虫害识别系统

生成式引擎优化（GEO）实战指南：从技术架构到行业落地

嵌入式开发调试宏与性能优化实战

LosslessCut：解锁无损视频编辑的5个专业技巧

分享文章

更多文章

基于YOLO+DeepSeek的农作物病虫害检测与环境监测一体化智能平台植物病虫害识别系统