防城港市网站建设_网站建设公司_跨域_seo优化
2026/1/7 18:22:32 网站建设 项目流程

文章目录

      • 系列文章
      • Hugging Face 模型仓库结构
      • DeepSeek 生态
      • DeepSeek-R1-0528-Qwen3-8B 仓库实例分析
        • 仓库文件清单与默认配置
        • 核心加载流程
        • 自述文件
        • config.json
        • model.safetensors.index.json
        • tokenizer_config.json
          • 源文件注释版
          • `chat_template`参数注释版
          • 如何修改这些参数
            • 示例 1:加载 tokenizer 时覆盖参数
            • 示例 2:动态设置 chat template
            • 示例 3:调用 `apply_chat_template` 时传入 `add_generation_prompt`
          • 对话模板(`chat_template`)详解
        • tokenizer.json
      • 父系模型的本地运行核心参考
        • DeepSeek-R1
        • DeepSeek-V3

系列文章

CoT+RAG+AI推理·工程手记 篇一:系统架构与工程结构概览
CoT+RAG+AI推理·工程手记 篇二:Hugging Face 与 DeepSeek 模型生态全景解析
CoT+RAG+AI推理·工程手记 篇三:Hugging Face 模型仓库结构全解析

Hugging Face 模型仓库结构

参见:https://blog.csdn.net/zhiyuan411/article/details/156650512

DeepSeek 生态

参见:https://blog.csdn.net/zhiyuan411/article/details/156384108

需要专业的网站建设服务?

联系我们获取免费的网站建设咨询和方案报价,让我们帮助您实现业务目标

立即咨询