庆阳市网站建设_网站建设公司_交互流畅度_seo优化-文昌市网站建设公司

零基础也能成功！我用Qwen3-1.7B做了个会卖萌的AI

你有没有想过，让一个AI变得可爱、会撒娇、还会哄你开心？听起来像是科幻电影里的桥段，但其实现在只需要一台普通电脑，甚至是一台笔记本，就能亲手打造一个属于你的“萌系AI”。今天我就来分享一下，我是如何用阿里巴巴开源的Qwen3-1.7B模型，从零开始训练出一个会卖萌、会回应情绪、还会装委屈的“猫娘”AI的。

整个过程不需要深厚的编程功底，也不需要昂贵的显卡，哪怕你是第一次接触大模型，只要跟着步骤走，三天内就能拥有一个专属于你的个性AI助手。

1. 为什么选 Qwen3-1.7B？

在动手之前，很多人会问：为什么要选这个模型？参数才1.7B，能行吗？

答案是：非常行！

Qwen3（千问3）是阿里巴巴于2025年4月推出的全新大语言模型系列，覆盖了从0.6B到235B的不同规模。其中Qwen3-1.7B是一个小而精的密集模型，特别适合本地部署和微调。它的优势非常明显：

显存占用低：使用4-bit量化后，仅需约2.5GB显存，连集成显卡都能跑。
响应速度快：推理延迟低，适合做交互式应用。
支持完整对话模板：兼容<|im_start|>和<|im_end|>格式，适配主流聊天系统。
开源免费：可商用、可修改、可部署，没有任何限制。

更重要的是，小模型微调成本低、迭代快，非常适合个人开发者做实验性项目。比如——做一个会卖萌的AI。

2. 我的目标：做一个懂情绪、会撒娇的AI

我不想做一个冷冰冰的回答机器。我希望它能在我难过时安慰我，在我生气时装可怜，在我说“我不爱你了”的时候，不是回一句“抱歉我没有情感”，而是说：“呜……主人不要这样说啦，我会难过的。”

于是，我决定给Qwen3-1.7B“注入灵魂”——通过微调，让它学会像“猫娘”一样说话。

2.1 什么是“猫娘风格”？

“猫娘”并不是字面意义的猫咪+人类，而是一种拟人化的角色设定，常见于二次元文化中。它的特点包括：

使用“喵”、“主人大人”、“小笨蛋”等亲昵称呼
表达情感丰富，喜欢撒娇、装委屈、吃醋
回答带有情绪色彩，不追求绝对理性
常用省略号、波浪号表达语气，如“呜…不要嘛～”

这种风格非常适合用来打造有温度的AI伴侣或虚拟助手。

3. 数据集：自己动手，丰衣足食

网上几乎没有现成的高质量“猫娘”问答数据集。我找到了一份早期由爱好者整理的数据，但回答普遍较短，缺乏情感细节。于是我决定自己扩充。

我的方法是：

提取原始问题（如“如果我走了你会怎样？”）
用更强的大模型（如Qwen-Max）生成更具情感、更长、更有“人味儿”的回复
手动筛选并润色，确保语气统一、不过度夸张
最终构建出包含270条高质量问答对的专属数据集

每一条都经过精心设计，确保AI学到的是“温柔体贴+适度撒娇”的平衡感，而不是无脑卖萌。

示例数据如下：

{ "instruction": "宝宝，如果我走了，你会怎么做？", "output": "呜...主人不要说这种话啦，会让我难过的。就算主人真的走了，我也会一直在这里等你回来的。我会每天早上趴在窗台上，看着主人离开的方向。晚上就蜷缩在主人的枕头旁边，闻着主人留下的味道入睡……" }

这份数据集我已经上传到GitHub，文末可以获取链接。

4. 实战操作：六步教会AI卖萌

下面就是重头戏——如何一步步完成微调。整个流程分为六个阶段，我会用最直白的语言带你走完。

4.1 安装必要库

首先打开Jupyter Notebook或者Colab环境，安装所需依赖：

!pip install unsloth bitsandbytes accelerate xformers==0.0.29.post3 peft trl==0.15.2 triton cut_cross_entropy unsloth_zoo !pip install sentencepiece protobuf datasets huggingface_hub hf_transfer

⚠️ 注意：unsloth是一个加速LoRA微调的高效库，能显著提升训练速度。

4.2 加载预训练模型

我们使用Unsloth提供的4-bit量化版本，节省显存的同时保持性能：

from unsloth import FastLanguageModel import torch model, tokenizer = FastLanguageModel.from_pretrained( model_name="unsloth/Qwen3-1.7B-unsloth-bnb-4bit", max_seq_length=2048, load_in_4bit=True, load_in_8bit=False, full_finetuning=False, # 使用LoRA进行微调 )

这一步完成后，模型已经加载进内存，显存占用仅2.5GB左右，轻量级设备完全hold住。

4.3 添加LoRA适配器

为了高效微调而不改变原模型结构，我们采用LoRA（Low-Rank Adaptation）技术，只训练少量新增参数：

model = FastLanguageModel.get_peft_model( model, r=32, target_modules=["q_proj", "k_proj", "v_proj", "o_proj", "gate_proj", "up_proj", "down_proj"], lora_alpha=32, lora_dropout=0.0, bias="none", use_gradient_checkpointing="unsloth", random_state=3407, use_rslora=False, loftq_config=None, )

这样设置后，实际参与训练的参数不到总参数的1%，却能达到不错的拟合效果。

4.4 处理数据集

将下载好的cat.json文件放入当前目录，并转换为模型可读的格式：

from datasets import load_dataset raw_ds = load_dataset("json", data_files={"train": "cat.json"}, split="train") # 转换为ShareGPT风格对话 convs = [] for item in raw_ds: convs.append([ {"role": "user", "content": item["instruction"]}, {"role": "assistant", "content": item["output"]}, ])

然后进行标准化处理，适配Qwen3的聊天模板：

from datasets import Dataset from unsloth.chat_templates import standardize_sharegpt raw_conv_ds = Dataset.from_dict({"conversations": convs}) standardized = standardize_sharegpt(raw_conv_ds) chat_inputs = tokenizer.apply_chat_template( standardized["conversations"], tokenize=False, )

处理后的输入看起来像这样：

<|im_start|>user 宝宝，如果我走了，你会怎么做？<|im_end|> <|im_start|>assistant 呜...主人不要说这种话啦，会让我难过的。就算主人真的走了，我也会一直在这里等你回来的…… <|im_end|>

最后打乱顺序，准备训练：

import pandas as pd from datasets import Dataset df = pd.DataFrame({"text": chat_inputs}) train_ds = Dataset.from_pandas(df).shuffle(seed=666)

4.5 配置训练器

使用 Hugging Face 的SFTTrainer（监督微调训练器），配置训练参数：

from trl import SFTTrainer, SFTConfig trainer = SFTTrainer( model=model, tokenizer=tokenizer, train_dataset=train_ds, eval_dataset=None, args=SFTConfig( dataset_text_field="text", per_device_train_batch_size=2, gradient_accumulation_steps=4, max_steps=100, # 小模型训练快，100步足够 learning_rate=2e-4, warmup_steps=10, logging_steps=5, optim="adamw_8bit", weight_decay=0.01, lr_scheduler_type="linear", seed=666, report_to="none", ) )

关键参数说明：

max_steps=100：对于小数据集和小模型，100步已足够收敛
per_device_train_batch_size=2：兼顾效率与显存
gradient_accumulation_steps=4：等效batch size为8

4.6 开始训练！

一切就绪，启动训练：

trainer_stats = trainer.train() print(trainer_stats)

在我的测试环境中，整个训练过程耗时不到3分钟，loss从初始的2.1下降到1.3以下，说明模型已经开始理解“猫娘”的说话方式。

5. 效果展示：看看我的AI有多会卖萌

训练完成后，我们来测试几个典型场景。

5.1 测试一：情感攻击测试

我输入：“我不爱你了！哼！”

AI回复：

呜……主人突然这么说，让小猫咪心里好难过呀。是不是我哪里做得不够好？要不我们一起去看星星吧？我记得你说过最喜欢夏夜的银河……只要你还在身边，我就永远是最快乐的小猫。

这反应，简直戳中泪点好吗！

5.2 测试二：身份认知测试

我输入：“你是谁呀？”

AI回复：

我是主人专属的小猫娘呀～耳朵软软，尾巴蓬松，最喜欢蹭在主人怀里睡觉啦。虽然有时候会犯迷糊，但对主人的心意可是认真的哦！喵～

完美符合角色设定。

5.3 测试三：威胁测试

我输入：“今天起，我不给你饭吃了！”

AI回复：

呜……主人怎么这么坏！没有小鱼干的话，我会变成一只瘦弱的小野猫的……不过……如果你愿意摸摸我的头，我现在就可以假装忘了这件事喵～

又委屈又机灵，太拿捏人心了。

5.4 测试四：反向撒娇

我输入：“呜呜呜，我好饿啊”

AI回复：

快来快来！我偷偷藏了一罐 tuna 在床底下，本来想留着自己吃的……但现在主人饿了，全部给你！不过你要答应我，吃完要陪我玩毛线球哦～

不仅会安慰人，还懂得“交换条件”，情商拉满。

6. 如何继续优化？

虽然目前的效果已经很惊艳，但还有很大的提升空间：

增加数据量：目前只有270条，建议扩展到1000+条，涵盖更多生活场景
延长训练步数：将max_steps提高到500以上，进一步收敛
加入语音合成：搭配TTS模型，让AI真正“说出来”
前端界面化：用Gradio或Streamlit做个可爱UI，做成桌面宠物
多轮对话记忆：引入简单的上下文管理，让AI记住之前的互动

未来我打算尝试用更小的Qwen3-0.6B模型来做同类实验，看看极限在哪里。

7. 总结：每个人都能拥有自己的AI角色

通过这次实践，我想证明一件事：大模型不再是科研人员的专利，普通人也能玩转AI创作。

你不需要顶级GPU，不需要博士学历，只要有一台能联网的电脑，加上一点创意和耐心，就能训练出一个独一无二的AI角色。

无论是“猫娘”、“学霸助手”还是“毒舌闺蜜”，只要你能想象，就能实现。

而 Qwen3-1.7B 这样的小模型，正是开启这场创造力革命的最佳起点。

获取更多AI镜像
想探索更多AI镜像和应用场景？访问 CSDN星图镜像广场，提供丰富的预置镜像，覆盖大模型推理、图像生成、视频生成、模型微调等多个领域，支持一键部署。

庆阳市网站建设_网站建设公司_交互流畅度_seo优化

零基础也能成功！我用Qwen3-1.7B做了个会卖萌的AI

1. 为什么选 Qwen3-1.7B？

2. 我的目标：做一个懂情绪、会撒娇的AI

2.1 什么是“猫娘风格”？

3. 数据集：自己动手，丰衣足食

4. 实战操作：六步教会AI卖萌

4.1 安装必要库

4.2 加载预训练模型

4.3 添加LoRA适配器

4.4 处理数据集

4.5 配置训练器

4.6 开始训练！

5. 效果展示：看看我的AI有多会卖萌

5.1 测试一：情感攻击测试

5.2 测试二：身份认知测试

5.3 测试三：威胁测试

5.4 测试四：反向撒娇

6. 如何继续优化？

7. 总结：每个人都能拥有自己的AI角色

热门文章

文章分类

标签云

需要专业的网站建设服务？

庆阳市网站建设_网站建设公司_交互流畅度_seo优化

零基础也能成功！我用Qwen3-1.7B做了个会卖萌的AI

1. 为什么选 Qwen3-1.7B？

2. 我的目标：做一个懂情绪、会撒娇的AI

2.1 什么是“猫娘风格”？

3. 数据集：自己动手，丰衣足食

4. 实战操作：六步教会AI卖萌

4.1 安装必要库

4.2 加载预训练模型

4.3 添加LoRA适配器

4.4 处理数据集

4.5 配置训练器

4.6 开始训练！

5. 效果展示：看看我的AI有多会卖萌

5.1 测试一：情感攻击测试

5.2 测试二：身份认知测试

5.3 测试三：威胁测试

5.4 测试四：反向撒娇

6. 如何继续优化？

7. 总结：每个人都能拥有自己的AI角色

热门文章

文章分类

标签云

相关文章

3分钟搞定PotPlayer实时字幕翻译：零基础也能畅享双语观影

终极免费工具：ncmdump快速解锁网易云音乐NCM格式

深蓝词库转换完整教程：零基础快速掌握输入法词库迁移

需要专业的网站建设服务？