铁岭市网站建设_网站建设公司_博客网站_seo优化-阳泉市网站建设公司

YOLO11+自定义数据集：打造专属检测模型

在计算机视觉领域，目标检测是核心任务之一。随着YOLO系列算法的持续演进，YOLO11作为最新一代版本，在精度、速度和灵活性方面实现了显著提升。本文将围绕如何使用YOLO11结合自定义数据集训练专属目标检测模型展开，涵盖从数据标注、格式转换、环境配置到模型训练与推理的完整流程。

通过本教程，你将掌握构建一个高精度定制化检测系统的全流程方法，并可将其应用于工业质检、智能监控、自动驾驶等实际场景。

1. 数据准备与标注

1.1 使用Labelme进行图像标注

高质量的数据是模型性能的基础。我们推荐使用开源工具Labelme进行手动标注。

操作步骤如下：

安装Labelme：
```
pip install labelme
```
启动工具并加载图像目录。
选择“创建矩形”模式，框选目标物体。
每个标注需指定类别名称（如car、bus）。
保存后生成与图片同名的JSON文件。

提示：确保所有图像尺寸一致或相近，避免极端缩放影响模型学习效果。

1.2 标注结果示例

Labelme生成的JSON文件包含图像元信息和多边形/矩形坐标。例如：

{ "imageWidth": 640, "imageHeight": 480, "shapes": [ { "label": "car", "points": [[100, 150], [300, 350]], "shape_type": "rectangle" } ] }

该结构记录了每个对象的位置和类别，但YOLO11需要特定格式的文本标签。

2. Labelme JSON转YOLO TXT格式

2.1 YOLO11标签格式规范

YOLO系列统一采用归一化的边界框表示法。每张图对应一个.txt标签文件，内容格式为：

<class_id> <x_center> <y_center> <width> <height>

其中：

class_id：类别索引（从0开始）
坐标与尺寸均相对于图像宽高的比例值（0~1）

例如：

0 0.5192 0.4512 0.3985 0.7572 3 0.5061 0.5921 0.2631 0.4561

2.2 转换脚本实现

以下Python代码可批量将Labelme的JSON标注转换为YOLO兼容格式：

import json import os # 类别映射表（根据实际项目修改） label_map = { "car": 0, "bus": 1, "person": 2 } def convert_labelme_to_yolo(json_path, output_dir): with open(json_path, 'r') as f: data = json.load(f) img_w = data['imageWidth'] img_h = data['imageHeight'] annotations = [] for shape in data['shapes']: label_name = shape['label'] if label_name not in label_map: continue class_id = label_map[label_name] points = shape['points'] if shape['shape_type'] == 'rectangle': (x1, y1), (x2, y2) = points elif shape['shape_type'] == 'polygon': x1 = min(p[0] for p in points) y1 = min(p[1] for p in points) x2 = max(p[0] for p in points) y2 = max(p[1] for p in points) else: continue # 归一化计算 xc = ((x1 + x2) / 2) / img_w yc = ((y1 + y2) / 2) / img_h w = (x2 - x1) / img_w h = (y2 - y1) / img_h annotations.append(f"{class_id} {xc:.6f} {yc:.6f} {w:.6f} {h:.6f}") # 写入输出文件 base_name = os.path.splitext(os.path.basename(json_path))[0] output_file = os.path.join(output_dir, base_name + '.txt') os.makedirs(output_dir, exist_ok=True) with open(output_file, 'w') as f: f.write('\n'.join(annotations)) def process_folder(input_folder, output_folder): for file_name in os.listdir(input_folder): if file_name.endswith('.json'): json_path = os.path.join(input_folder, file_name) convert_labelme_to_yolo(json_path, output_folder) # 执行转换 input_folder = "/mnt/data/json_labels" output_folder = "/mnt/data/yolo11_txt_labels" process_folder(input_folder, output_folder)

运行后将在指定路径下生成对应的.txt标签文件，供后续训练使用。

3. 配置YOLO11工程环境

3.1 获取YOLO11源码

YOLO11由Ultralytics团队维护，可通过GitHub获取最新代码：

git clone https://github.com/ultralytics/ultralytics.git cd ultralytics pip install -e .

或者直接下载ZIP包解压使用。

3.2 项目目录结构规划

建议组织如下目录结构以保持清晰：

ultralytics-8.3.9/ ├── datasets/ │ ├── train/images/ │ ├── train/labels/ │ ├── val/images/ │ └── val/labels/ ├── weights/ # 存放预训练权重 ├── runs/ # 训练输出目录 ├── ultralytics/ # 核心库 ├── train.py # 自定义训练脚本 └── infer.py # 推理脚本

将转换后的图像和标签分别放入datasets/train和datasets/val中。

4. 数据集配置文件（YAML）

在ultralytics/cfg/datasets/目录下新建自定义数据集配置文件，如auto-parts-det.yaml：

# 数据集根路径 path: ./datasets/det_auto_parts_20241020 # 训练集与验证集路径（相对于path） train: train/images val: val/images # 类别名称列表 names: 0: car 1: bus 2: person

⚠️ 注意：path应指向包含train和val子目录的根目录，路径支持相对或绝对形式。

此文件将在训练时被模型加载器读取，用于定位数据和解析类别。

5. YOLO11模型结构配置

5.1 模型配置文件位置

YOLO11的网络架构定义位于：

ultralytics/cfg/models/11/yolo11.yaml

该文件描述了Backbone、Neck和Head的完整结构，包括卷积层、CSP模块、上采样与拼接操作等。

5.2 关键参数说明

参数	含义
`nc`	类别数量（需根据数据集调整）
`scales`	不同规模模型（n/s/m/l/x）的深度与宽度系数
`backbone`	主干网络结构
`head`	检测头结构，含FPN/PAN结构

若新增类别，务必更新nc字段。例如三分类任务应设为：

nc: 3

也可基于此文件创建自定义变体，如yolo11-custom.yaml。

6. 编写训练脚本

6.1 加载模型与预训练权重

使用YOLO类初始化模型，并加载官方提供的预训练权重以加速收敛：

from ultralytics import YOLO # 加载模型配置并注入预训练权重 model = YOLO("yolo11m.yaml").load("weights/yolo11m.pt")

✅ 推荐使用中等规模模型（如yolo11m），兼顾性能与效率。

6.2 设置训练参数

通过字典方式传入训练超参数，便于管理和复现：

train_params = { 'data': 'auto-parts-det.yaml', # 数据集配置 'epochs': 100, # 总训练轮数 'imgsz': 640, # 输入图像大小 'batch': 8, # 批次大小 'device': 0, # GPU设备ID（None自动选择） 'workers': 8, # 数据加载线程数 'optimizer': 'AdamW', # 优化器类型 'lr0': 0.001, # 初始学习率 'weight_decay': 0.0005, 'warmup_epochs': 3.0, 'box': 7.5, 'cls': 0.5, 'dfl': 1.5, 'save': True, 'save_period': -1, 'project': 'runs/train', 'name': 'exp_auto_parts', 'exist_ok': False, 'resume': False, 'amp': True, # 启用混合精度 'verbose': True, 'seed': 42, 'plots': True, # 数据增强 'hsv_h': 0.015, 'hsv_s': 0.7, 'hsv_v': 0.4, 'degrees': 10.0, 'translate': 0.1, 'scale': 0.5, 'flipud': 0.0, 'fliplr': 0.5, 'mosaic': 1.0, 'mixup': 0.1, 'copy_paste': 0.0, }

6.3 开始训练

调用train()方法启动训练过程：

results = model.train(**train_params)

训练日志将实时显示损失、mAP等指标，最佳模型自动保存至runs/train/exp_auto_parts/weights/best.pt。

7. 模型训练执行与监控

7.1 启动训练命令

进入项目根目录后运行：

cd ultralytics-8.3.9/ python train.py

7.2 训练输出示例

Ultralytics 8.3.7 🚀 Python-3.9.16 torch-1.13.1 CUDA:0 (NVIDIA A30, 24062MiB) Starting training for 100 epochs... Epoch GPU_mem box_loss cls_loss dfl_loss Instances Size 1/100 4.68G 2.238 1.691 2.426 80 640: 100%|███████| 16/16 [00:02<00:00, 5.91it/s] Class Images Instances Box(P R mAP50 mAP50-95): 100%|███████| 8/8 [00:00<00:00, 12.18it/s] all 128 929 0.77 0.728 0.798 0.615 ... 100/100 4.49G 1.171 0.7135 1.319 41 640: 100%|███████| 16/16 [00:01<00:00, 8.80it/s] Class Images Instances Box(P R mAP50 mAP50-95): 100%|███████| 8/8 [00:00<00:00, 13.42it/s] all 128 929 0.847 0.845 0.891 0.577

最终模型在验证集上达到较高mAP50值，表明具备良好检测能力。

8. 模型推理与结果可视化

8.1 加载训练好的模型

使用保存的最佳权重进行推理：

from ultralytics import YOLO model = YOLO("runs/detect/train5/weights/best.pt")

8.2 执行预测

支持图像、视频、摄像头等多种输入源：

results = model.predict( source="datasets/test_images/", conf=0.45, iou=0.6, imgsz=640, device=0, save=True, save_txt=True, show_labels=True, show_conf=True )

8.3 输出内容

检测框图像（带标签与置信度）
文本格式的检测结果（.txt）
可视化分析图表（PR曲线、混淆矩阵等）

可在runs/detect/predict/目录查看输出结果。

9. 总结

本文系统介绍了基于YOLO11构建自定义目标检测模型的全流程：

数据标注：使用Labelme完成高质量人工标注；
格式转换：编写脚本将JSON转为YOLO标准TXT格式；
环境搭建：配置Ultralytics开发环境及项目结构；
数据集定义：编写YAML配置文件明确路径与类别；
模型配置：选用合适规模的YOLO11架构；
训练脚本：设置合理超参数并启动训练；
模型评估：观察训练日志与验证指标；
推理应用：部署模型于新数据进行检测。

通过这一完整流程，你可以快速构建适用于特定场景的高性能检测系统。YOLO11凭借其简洁API和强大性能，极大降低了深度学习落地门槛。

未来可进一步探索自动标注、增量学习、ONNX导出与边缘部署等进阶方向，持续优化模型实用性。

获取更多AI镜像
想探索更多AI镜像和应用场景？访问 CSDN星图镜像广场，提供丰富的预置镜像，覆盖大模型推理、图像生成、视频生成、模型微调等多个领域，支持一键部署。

铁岭市网站建设_网站建设公司_博客网站_seo优化

YOLO11+自定义数据集：打造专属检测模型

1. 数据准备与标注

1.1 使用Labelme进行图像标注

1.2 标注结果示例

2. Labelme JSON转YOLO TXT格式

2.1 YOLO11标签格式规范

2.2 转换脚本实现

3. 配置YOLO11工程环境

3.1 获取YOLO11源码

3.2 项目目录结构规划

4. 数据集配置文件（YAML）

5. YOLO11模型结构配置

5.1 模型配置文件位置

5.2 关键参数说明

6. 编写训练脚本

6.1 加载模型与预训练权重

6.2 设置训练参数

6.3 开始训练

7. 模型训练执行与监控

7.1 启动训练命令

7.2 训练输出示例

8. 模型推理与结果可视化

8.1 加载训练好的模型

8.2 执行预测

8.3 输出内容

9. 总结

热门文章

文章分类

标签云

需要专业的网站建设服务？

铁岭市网站建设_网站建设公司_博客网站_seo优化

YOLO11+自定义数据集：打造专属检测模型

1. 数据准备与标注

1.1 使用Labelme进行图像标注

1.2 标注结果示例

2. Labelme JSON转YOLO TXT格式

2.1 YOLO11标签格式规范

2.2 转换脚本实现

3. 配置YOLO11工程环境

3.1 获取YOLO11源码

3.2 项目目录结构规划

4. 数据集配置文件（YAML）

5. YOLO11模型结构配置

5.1 模型配置文件位置

5.2 关键参数说明

6. 编写训练脚本

6.1 加载模型与预训练权重

6.2 设置训练参数

6.3 开始训练

7. 模型训练执行与监控

7.1 启动训练命令

7.2 训练输出示例

8. 模型推理与结果可视化

8.1 加载训练好的模型

8.2 执行预测

8.3 输出内容

9. 总结

热门文章

文章分类

标签云

相关文章

小白也能懂的Z-Image-Turbo：文生图一键启动指南

TTS服务并发低？CosyVoice-300M Lite压力测试优化案例

ST7789V多设备共用SPI引脚设计方案

需要专业的网站建设服务？