摘要:本数据集是一个专门针对公共区域发传单行为的目标检测数据集,包含 3,443 张真实场景图像和 6,886 个精确标注框。 数据集采用 YOLO 格式标注,涵盖 person(人员)和 leaflet(传单)两个核心类别, 旨在支持公共空间中人员与传单交互行为的智能识别与分析。
作者:Bob (张家梁)
数据大小:6G
原创声明:本项目为原创作品
数据集简介
一个包含 3,443 张真实场景图像的 YOLO 格式目标检测数据集,用于识别公共区域中的人员与传单交互行为。
数据集概述
本数据集是一个专门针对公共区域发传单行为的目标检测数据集,包含 3,443 张真实场景图像和 6,886 个精确标注框。 数据集采用 YOLO 格式标注,涵盖 person(人员)和 leaflet(传单)两个核心类别, 旨在支持公共空间中人员与传单交互行为的智能识别与分析。
数据来源于商业街、广场、步行区等多样化公共通行区域的现场采集,覆盖不同光照条件、背景复杂度和遮挡程度, 确保模型在真实部署环境中的鲁棒性与泛化能力。数据集按照 70% / 20% / 10% 的比例划分为训练集(2,410 张)、 验证集(688 张)和测试集(345 张),并经过双阶段质量控制流程,保证标注的准确性与一致性。
该数据集适用于基于 YOLOv13 及其他 YOLO 系列模型的目标检测任务,可为城市管理、公共安全监控、 行为分析等领域的计算机视觉应用提供高质量训练数据支持。推荐使用 mAP@0.5 和 mAP@0.5:0.95 等标准指标进行模型评估, 并分别报告各类别的检测性能。
数据集来源
本数据集来源于真实公共空间的现场采集图像,覆盖人员与传单的 多样化出现形态。场景包含公共通行区域(如机场区域等) 的人群交互情形,具有不同光照、背景复杂度与遮挡程度,以增强模型 对实际部署环境的泛化能力。
类别定义
标注规范
标注采用 YOLO 格式:每个目标一行,字段为 class x_center y_center width height, 坐标均为相对归一化(0~1)。
图1 标注规范图
数据规模与划分
- 总图像数:3443;总标注框数:6886
图2 数据集在训练、验证和测试集上的分布
数据集按照约 70:20:10 的比例划分为训练集、验证集和测试集:
表1 数据集划分及用途说明
质量控制
标注采用双阶段质量控制流程:首先进行规范化标注与自检, 确保目标框贴合实例外接矩形且类别一致;随后进行抽样复核, 针对漏标、错标与框位置偏差进行纠正。对争议样本进行二次确认, 以提高跨标注者一致性与总体标注可靠性。
数据格式与使用
数据集采用标准 YOLO 格式组织,通过 data.yaml 配置文件即可快速集成到训练流程中。
目录结构
数据集采用标准 YOLO 格式组织,图像和标注文件分别存放在 images/ 和 labels/ 目录下,并按训练集、验证集、测试集划分。
使用方式
在训练脚本中指定 data.yaml 即可加载数据:
示例展示
数据集包含多种典型场景的标注样本:
性能评测
基于 YOLOv11 模型在本数据集上进行训练和评测,使用mAP@0.5与mAP@0.5:0.95等标准指标对模型检测效果进行评估。评测结果如下:
训练过程综合指标曲线图
图3 训练与验证指标随Epoch变化趋势图
精确率-召回率(PR)曲线图
图4 目标检测PR曲线(Precision-Recall)
F1分数-置信度阈值曲线图
图5 不同置信度阈值下的F1曲线
归一化混淆矩阵图(分类误判分析)
图6 归一化混淆矩阵(person / leaflet)
应用案例
- 案例1:基于多尺度深度卷积增强的YOLO11公共区域发传单违规行为检测系统
图7 应用案例:基于多尺度深度卷积增强的YOLO11公共区域发传单违规行为检测系统
免责声明与引用
数据仅用于科研与教学用途。若用于商业场景,请自行核验数据许可。 如需引用,请在论文或报告中注明数据集名称与版本号。