医学中医-中草药检测数据集
45种中草药图集已标注,YOLO格式
训练集:8500张
验证集:1500张
每种中药有1000张图片
1
1
🌿 中草药检测数据集(YOLO格式)
总类别数:45 种
总图像数量:10,000 张
标注框总数:16,754 个
标签格式:YOLO(.txt)
文件格式:JPG / PNG
| 项目 | 内容说明 |
|---|---|
| 数据集名称 | 中草药检测数据集(45类) |
| 类别数量 | 45 类 |
| 总图像数量 | 10,000 张 |
| 标注框总数 | 16,754 个(平均每个图像约 1.68 个目标) |
| 数据划分 | |
| – 训练集 | 8,500 张 |
| – 验证集 | 1,500 张 |
| 每类样本数量 | 原始设计为“每种中药有 1000 张”,但实际统计显示部分类别不足(如人参仅90张) |
| 标注方式 | 手动标注(使用 LabelImg 或类似工具),边界框(Bounding Box) |
| 标签格式 | ✅ YOLO 格式.txt文件:• class_id x_center y_center width height(归一化坐标)• 支持直接用于 YOLOv5/v8 等模型训练 |
| 图像格式 | JPG / PNG(高清扫描图或实物拍摄) |
| 图像分辨率 | 多样化(常见 800×600 至 2048×1536,取决于拍摄设备) |
| 背景复杂度 | 包含纯白背景、木质桌面、药材堆叠等场景,适合真实应用 |
| 典型应用场景 | • 中药材智能识别 • 药材质量分级 • 中医AI辅助诊断系统 • 自动化分拣机器人 |
📊 类别统计表(前45类)
| 类别ID | 类别名称 | 图片数量 | 标注数量 |
|---|---|---|---|
| 0 | 白茯苓 | 309 | 555 |
| 1 | 白芍 | 356 | 860 |
| 2 | 白术 | 452 | 853 |
| 3 | 蒲公英 | 177 | 177 |
| 4 | 甘草 | 394 | 1026 |
| 5 | 栀子 | 190 | 190 |
| 6 | 党参 | 340 | 522 |
| 7 | 桃仁 | 96 | 172 |
| 8 | 去皮桃仁 | 164 | 164 |
| 9 | 地肤子 | 280 | 280 |
| 10 | 牡丹皮 | 51 | 78 |
| 11 | 冬虫夏草 | 359 | 675 |
| 12 | 杜仲 | 106 | 112 |
| 13 | 当归 | 518 | 925 |
| 14 | 杏仁 | 179 | 180 |
| 15 | 何首乌 | 267 | 598 |
| 16 | 黄精 | 298 | 499 |
| 17 | 鸡血藤 | 146 | 146 |
| 18 | 枸杞 | 477 | 807 |
| 19 | 莲须 | 292 | 341 |
| 20 | 莲肉 | 415 | 613 |
| 21 | 麦门冬 | 141 | 176 |
| 22 | 木通 | 201 | 201 |
| 23 | 玉竹 | 228 | 833 |
| 24 | 女贞子 | 258 | 286 |
| 25 | 肉苁蓉 | 203 | 271 |
| 26 | 人参 | 90 | 108 |
| 27 | 乌梅 | 191 | 191 |
| 28 | 覆盆子 | 167 | 167 |
| 29 | 瓜蒌皮 | 164 | 164 |
| 30 | 肉桂 | 330 | 431 |
| 31 | 山茱萸 | 212 | 212 |
| 32 | 山药 | 86 | 86 |
| 33 | 酸枣仁 | 276 | 298 |
| 34 | 桑白皮 | 122 | 122 |
| 35 | 山楂 | 310 | 474 |
| 36 | 天麻 | 97 | 97 |
| 37 | 熟地黄 | 407 | 508 |
| 38 | 小茴香 | 165 | 165 |
| 39 | 泽泻 | 126 | 186 |
| 40 | 竹茹 | 121 | 130 |
| 41 | 川贝母 | 133 | 228 |
| 42 | 川芎 | 561 | 1173 |
| 43 | 玄参 | 149 | 149 |
| 44 | 益智仁 | 265 | 325 |
| 总计 | - | 10,000 | 16,754 |
⚠️备注:
- 总图片数为 10,000 张,但部分类别远少于 1000 张(如“人参”仅90张,“山药”86张),可能为标注未完成或采样不均;
- “川芎”类别标注最多(1173个),可能是多粒密集分布;
- “蒲公英”和“鸡血藤”等类别标注数量等于图片数,说明每图仅一个目标。
📁 数据目录结构示例
herbal_dataset/ ├── images/ │ ├── train/ # 8500 张 │ ├── val/ # 1500 张 │ └── test/ # (可选) └── labels/ ├── train/ # 对应 .txt 文件 └── val/✅ 支持的模型任务
| 任务类型 | 是否支持 | 说明 |
|---|---|---|
| 目标检测(YOLO) | ✅ | 使用 YOLOv5/v8 可直接训练 |
| 分类任务 | ✅ | 可提取特征用于分类器 |
| 实例分割(Mask) | ❌ | 无 mask 标注 |
| 多标签识别 | ❌ | 单目标为主 |
🛠️ 推荐训练方案(YOLOv8)
1. 创建data.yaml
# data.yamlpath:./herbal_datasettrain:images/trainval:images/valnc:45names:['白茯苓','白芍','白术','蒲公英','甘草','栀子','党参','桃仁','去皮桃仁','地肤子','牡丹皮','冬虫夏草','杜仲','当归','杏仁','何首乌','黄精','鸡血藤','枸杞','莲须','莲肉','麦门冬','木通','玉竹','女贞子','肉苁蓉','人参','乌梅','覆盆子','瓜蒌皮','肉桂','山茱萸','山药','酸枣仁','桑白皮','山楂','天麻','熟地黄','小茴香','泽泻','竹茹','川贝母','川芎','玄参','益智仁']2. 训练代码(train.py)
fromultralyticsimportYOLO model=YOLO('yolov8n.pt')# 或 yolov8s.ptresults=model.train(data='data.yaml',epochs=100,imgsz=640,batch=16,name='herbal_detection',device=0,patience=20,hsv_h=0.01,hsv_s=0.5,hsv_v=0.3,degrees=10.0)🌱总结:该数据集是中医药 AI 智能识别的宝贵资源,适用于中药材自动化分拣、质量控制、中医教学系统等场景。尽管部分类别样本偏少,但整体覆盖广泛,适合构建高性能目标检测模型。