文章目录
- 系列文章
- 源码注释版
- 核心流程解析
- 1. 单例模式初始化与模型加载流程(模块入口,仅执行一次)
- 2. 合规 Prompt 构建与格式化流程(生成任务前置准备)
- 3. 基础同步生成流程(`generate` 方法,一次性返回完整结果)
- 4. 流式生成流程(`stream_generate` 方法,逐 Token 返回结果)
- 5. 多轮流式对话流程(`stream_chat_multi_turn` 方法,支持上下文保持)
- 多轮对话处理机制详解
- `chat_template` 支持的功能
- 使用方式
系列文章
CoT+RAG+AI推理·工程手记 篇一:系统架构与工程结构概览
CoT+RAG+AI推理·工程手记 篇二:Hugging Face 与 DeepSeek 模型生态全景解析
CoT+RAG+AI推理·工程手记 篇三:Hugging Face 模型仓库结构全解析
CoT+RAG+AI推理·工程手记 篇四:DeepSeek-R1-0528-Qwen3-8B 模型解析
CoT+RAG+AI推理·工程手记 篇五:BGE-Large-ZH-V1.5 模型解析
源码注释版
#!/usr/bin/env python3