一、项目介绍
摘要
本项目基于前沿的YOLOv10目标检测算法,开发了一套专门针对建筑工地运输车辆的智能识别系统,能够准确检测和分类三种典型工地运输车辆:挖掘机(EXCAVATORS)、自卸车(dump truck)和轮式装载机(wheel loader)。系统通过对工地监控视频或现场拍摄图像的实时分析,自动识别画面中的工程车辆并标记其位置和类型,为工地安全管理、车辆调度和自动化施工监控提供数据支持。项目使用包含2,655张精细标注图像的专业数据集进行模型训练和验证,其中训练集2,244张,验证集267张,测试集144张。该系统可广泛应用于智能工地建设、施工进度监控、工程车辆管理等领域,具有显著的工程应用价值。
项目意义
智能工地建设:实现工地运输车辆的自动化识别和统计,推动传统建筑工地向数字化、智能化转型。
施工安全管理:实时监控工地内重型车辆的分布和移动情况,预防车辆碰撞事故,提升工地安全水平。
施工效率优化:通过车辆识别数据分析各区域车辆密度,优化资源配置和车辆调度,提高施工效率。
进度自动监控:根据不同类型工程车辆的活跃情况,辅助判断施工进度和阶段特征。
自动驾驶工程机械协同:为未来自动驾驶工程机械提供环境感知基础,实现人机协同作业。
违规操作识别:检测车辆在非工作时段或未授权区域的异常活动,加强工地管理规范。
计算机视觉技术落地:探索先进目标检测算法在建筑行业的专业化应用场景,促进行业技术创新。
目录
一、项目介绍
摘要
项目意义
二、项目功能展示
系统功能
图片检测
视频检测
摄像头实时检测
三、数据集介绍
数据集概述
数据集特点
数据集配置文件
数据集制作流程
四、项目环境配置
创建虚拟环境
pycharm中配置anaconda
安装所需要库
五、模型训练
训练代码
训练结果
六、核心代码
七、项目源码(视频下方简介内)
基于深度学习YOLOv10的工地运输车识别检测系统(YOLOv10+YOLO数据集+UI界面+Python项目源码+模型) ————————————————_哔哩哔哩_bilibili
基于深度学习YOLOv10的工地运输车识别检测系统(YOLOv10+YOLO数据集+UI界面+Python项目源码+模型) ————————————————
二、项目功能展示
系统功能
✅图片检测:可对图片进行检测,返回检测框及类别信息。
✅视频检测:支持视频文件输入,检测视频中每一帧的情况。
✅摄像头实时检测:连接USB 摄像头,实现实时监测。
✅参数实时调节(置信度和IoU阈值)
图片检测
该功能允许用户通过单张图片进行目标检测。输入一张图片后,YOLO模型会实时分析图像,识别出其中的目标,并在图像中框出检测到的目标,输出带有目标框的图像。
视频检测
视频检测功能允许用户将视频文件作为输入。YOLO模型将逐帧分析视频,并在每一帧中标记出检测到的目标。最终结果可以是带有目标框的视频文件或实时展示,适用于视频监控和分析等场景。
摄像头实时检测
该功能支持通过连接摄像头进行实时目标检测。YOLO模型能够在摄像头拍摄的实时视频流中进行目标检测,实时识别并显示检测结果。此功能非常适用于安防监控、无人驾驶、智能交通等应用,提供即时反馈。
核心特点:
- 高精度:基于YOLO模型,提供精确的目标检测能力,适用于不同类型的图像和视频。
- 实时性:特别优化的算法使得实时目标检测成为可能,无论是在视频还是摄像头实时检测中,响应速度都非常快。
- 批量处理:支持高效的批量图像和视频处理,适合大规模数据分析。
三、数据集介绍
数据集概述
本项目的核心数据集是专门针对工地运输车辆构建的专业图像数据集,共包含2,655张高质量标注图像,按照约8:1:1的比例划分为训练集(2,244张)、验证集(267张)和测试集(144张)。数据集覆盖了三种典型工地运输车辆:挖掘机、自卸车和轮式装载机,所有图像均由建筑行业专业人员参与标注,确保类别判断的准确性和专业性。
数据集特点
目标多样性:
包含三种差异明显的工程车辆类型
覆盖不同品牌、型号和尺寸的各类车辆
车辆处于各种工作状态(运行、静止、装卸等)
多种车辆颜色和外观装饰变化
场景复杂性:
不同施工阶段的工地场景(土方工程、结构施工等)
各种天气条件(晴天、阴天、雨天、雾天)
不同时段采集数据(清晨、正午、黄昏、夜间)
多种拍摄角度和距离(地面视角、监控俯瞰等)
挑战性因素:
车辆部分遮挡(被建筑物料、其他设备遮挡)
密集车辆场景下的重叠和交叉
强光影干扰(金属反光、阴影区域)
运动模糊(移动中车辆的图像捕捉)
标注专业性:
由具有建筑行业知识的人员参与标注,确保车辆类型判断准确
采用紧密贴合车辆轮廓的精确边界框
特别标注了车辆的工作状态属性(可选)
对困难样本(模糊、小目标等)进行特殊标记
数据分布:
三类车辆样本数量均衡
覆盖各种典型施工场景
包含正常工作和异常情况的样本
训练集与测试集场景分布一致
数据集配置文件
项目采用YOLO格式的数据集:
train: F:\工地运输车识别检测数据集\train\images val: F:\工地运输车识别检测数据集\valid\images test: F:\工地运输车识别检测数据集\test\images nc: 3 names: ['EXCAVATORS', 'dump truck', 'wheel loader']数据集制作流程
数据采集阶段:
实地采集:在多个大型建筑工地使用高清摄像机进行多角度拍摄
监控视频提取:从工地安防系统获取监控视频并提取关键帧
无人机航拍:获取工地全景中的车辆分布图像
公开数据补充:筛选合适的网络图像资源(确保版权合规)
数据预处理:
图像去重:去除高度相似图像
分辨率调整:统一缩放,保持原始宽高比
格式统一:转换为JPG格式
曝光校正:对过暗/过亮图像进行自适应直方图均衡化
数据集划分方法:
按工地项目分层抽样,确保不同工地数据均匀分布
同一工地的连续视频帧不会跨训练/验证/测试集
保留最具挑战性的样本作为测试集
验证集包含所有典型场景的代表性样本
质量控制体系:
建立标注质量KPI
开发自动化校验工具检查标注格式一致性
定期抽样人工复检,维持标注质量
版本化管理,记录每次数据集更新的变更内容
持续优化机制:
收集模型预测错误的样本进行针对性补充
定期纳入新型工程车辆数据
根据实际应用反馈扩展特殊场景样本
建立数据质量-模型性能闭环优化流程
四、项目环境配置
创建虚拟环境
首先新建一个Anaconda环境,每个项目用不同的环境,这样项目中所用的依赖包互不干扰。
终端输入
conda create -n yolov10 python==3.9
激活虚拟环境
conda activate yolov10
安装cpu版本pytorch
pip install torch torchvision torchaudio
pycharm中配置anaconda
安装所需要库
pip install -r requirements.txt
五、模型训练
训练代码
from ultralytics import YOLOv10 model_path = 'yolov10s.pt' data_path = 'datasets/data.yaml' if __name__ == '__main__': model = YOLOv10(model_path) results = model.train(data=data_path, epochs=500, batch=64, device='0', workers=0, project='runs/detect', name='exp', )根据实际情况更换模型 yolov10n.yaml (nano):轻量化模型,适合嵌入式设备,速度快但精度略低。 yolov10s.yaml (small):小模型,适合实时任务。 yolov10m.yaml (medium):中等大小模型,兼顾速度和精度。 yolov10b.yaml (base):基本版模型,适合大部分应用场景。 yolov10l.yaml (large):大型模型,适合对精度要求高的任务。
--batch 64:每批次64张图像。--epochs 500:训练500轮。--datasets/data.yaml:数据集配置文件。--weights yolov10s.pt:初始化模型权重,yolov10s.pt是预训练的轻量级YOLO模型。
训练结果
六、核心代码
import sys import cv2 import numpy as np from PyQt5.QtWidgets import QApplication, QMessageBox, QFileDialog from PyQt5.QtCore import QThread, pyqtSignal from ultralytics import YOLOv10 from UiMain import UiMainWindow import time import os class DetectionThread(QThread): frame_received = pyqtSignal(np.ndarray, np.ndarray, list) # 原始帧, 检测帧, 检测结果 finished_signal = pyqtSignal() # 线程完成信号 def __init__(self, model, source, conf, iou, parent=None): super().__init__(parent) self.model = model self.source = source self.conf = conf self.iou = iou self.running = True def run(self): try: if isinstance(self.source, int) or self.source.endswith(('.mp4', '.avi', '.mov')): # 视频或摄像头 cap = cv2.VideoCapture(self.source) while self.running and cap.isOpened(): ret, frame = cap.read() if not ret: break # 保存原始帧 original_frame = frame.copy() # 检测 results = self.model(frame, conf=self.conf, iou=self.iou) annotated_frame = results[0].plot() # 提取检测结果 detections = [] for result in results: for box in result.boxes: class_id = int(box.cls) class_name = self.model.names[class_id] confidence = float(box.conf) x, y, w, h = box.xywh[0].tolist() detections.append((class_name, confidence, x, y)) # 发送信号 self.frame_received.emit( cv2.cvtColor(original_frame, cv2.COLOR_BGR2RGB), cv2.cvtColor(annotated_frame, cv2.COLOR_BGR2RGB), detections ) # 控制帧率 time.sleep(0.03) # 约30fps cap.release() else: # 图片 frame = cv2.imread(self.source) if frame is not None: original_frame = frame.copy() results = self.model(frame, conf=self.conf, iou=self.iou) annotated_frame = results[0].plot() # 提取检测结果 detections = [] for result in results: for box in result.boxes: class_id = int(box.cls) class_name = self.model.names[class_id] confidence = float(box.conf) x, y, w, h = box.xywh[0].tolist() detections.append((class_name, confidence, x, y)) self.frame_received.emit( cv2.cvtColor(original_frame, cv2.COLOR_BGR2RGB), cv2.cvtColor(annotated_frame, cv2.COLOR_BGR2RGB), detections ) except Exception as e: print(f"Detection error: {e}") finally: self.finished_signal.emit() def stop(self): self.running = False class MainWindow(UiMainWindow): def __init__(self): super().__init__() # 初始化模型 self.model = None self.detection_thread = None self.current_image = None self.current_result = None self.video_writer = None self.is_camera_running = False self.is_video_running = False self.last_detection_result = None # 新增:保存最后一次检测结果 # 连接按钮信号 self.image_btn.clicked.connect(self.detect_image) self.video_btn.clicked.connect(self.detect_video) self.camera_btn.clicked.connect(self.detect_camera) self.stop_btn.clicked.connect(self.stop_detection) self.save_btn.clicked.connect(self.save_result) # 初始化模型 self.load_model() def load_model(self): try: model_name = self.model_combo.currentText() self.model = YOLOv10(f"{model_name}.pt") # 自动下载或加载本地模型 self.update_status(f"模型 {model_name} 加载成功") except Exception as e: QMessageBox.critical(self, "错误", f"模型加载失败: {str(e)}") self.update_status("模型加载失败") def detect_image(self): if self.detection_thread and self.detection_thread.isRunning(): QMessageBox.warning(self, "警告", "请先停止当前检测任务") return file_path, _ = QFileDialog.getOpenFileName( self, "选择图片", "", "图片文件 (*.jpg *.jpeg *.png *.bmp)") if file_path: self.clear_results() self.current_image = cv2.imread(file_path) self.current_image = cv2.cvtColor(self.current_image, cv2.COLOR_BGR2RGB) self.display_image(self.original_image_label, self.current_image) # 创建检测线程 conf = self.confidence_spinbox.value() iou = self.iou_spinbox.value() self.detection_thread = DetectionThread(self.model, file_path, conf, iou) self.detection_thread.frame_received.connect(self.on_frame_received) self.detection_thread.finished_signal.connect(self.on_detection_finished) self.detection_thread.start() self.update_status(f"正在检测图片: {os.path.basename(file_path)}") def detect_video(self): if self.detection_thread and self.detection_thread.isRunning(): QMessageBox.warning(self, "警告", "请先停止当前检测任务") return file_path, _ = QFileDialog.getOpenFileName( self, "选择视频", "", "视频文件 (*.mp4 *.avi *.mov)") if file_path: self.clear_results() self.is_video_running = True # 初始化视频写入器 cap = cv2.VideoCapture(file_path) frame_width = int(cap.get(cv2.CAP_PROP_FRAME_WIDTH)) frame_height = int(cap.get(cv2.CAP_PROP_FRAME_HEIGHT)) fps = cap.get(cv2.CAP_PROP_FPS) cap.release() # 创建保存路径 save_dir = "results" os.makedirs(save_dir, exist_ok=True) timestamp = time.strftime("%Y%m%d_%H%M%S") save_path = os.path.join(save_dir, f"result_{timestamp}.mp4") fourcc = cv2.VideoWriter_fourcc(*'mp4v') self.video_writer = cv2.VideoWriter(save_path, fourcc, fps, (frame_width, frame_height)) # 创建检测线程 conf = self.confidence_spinbox.value() iou = self.iou_spinbox.value() self.detection_thread = DetectionThread(self.model, file_path, conf, iou) self.detection_thread.frame_received.connect(self.on_frame_received) self.detection_thread.finished_signal.connect(self.on_detection_finished) self.detection_thread.start() self.update_status(f"正在检测视频: {os.path.basename(file_path)}") def detect_camera(self): if self.detection_thread and self.detection_thread.isRunning(): QMessageBox.warning(self, "警告", "请先停止当前检测任务") return self.clear_results() self.is_camera_running = True # 创建检测线程 (默认使用摄像头0) conf = self.confidence_spinbox.value() iou = self.iou_spinbox.value() self.detection_thread = DetectionThread(self.model, 0, conf, iou) self.detection_thread.frame_received.connect(self.on_frame_received) self.detection_thread.finished_signal.connect(self.on_detection_finished) self.detection_thread.start() self.update_status("正在从摄像头检测...") def stop_detection(self): if self.detection_thread and self.detection_thread.isRunning(): self.detection_thread.stop() self.detection_thread.quit() self.detection_thread.wait() if self.video_writer: self.video_writer.release() self.video_writer = None self.is_camera_running = False self.is_video_running = False self.update_status("检测已停止") def on_frame_received(self, original_frame, result_frame, detections): # 更新原始图像和结果图像 self.display_image(self.original_image_label, original_frame) self.display_image(self.result_image_label, result_frame) # 保存当前结果帧用于后续保存 self.last_detection_result = result_frame # 新增:保存检测结果 # 更新表格 self.clear_results() for class_name, confidence, x, y in detections: self.add_detection_result(class_name, confidence, x, y) # 保存视频帧 if self.video_writer: self.video_writer.write(cv2.cvtColor(result_frame, cv2.COLOR_RGB2BGR)) def on_detection_finished(self): if self.video_writer: self.video_writer.release() self.video_writer = None self.update_status("视频检测完成,结果已保存") elif self.is_camera_running: self.update_status("摄像头检测已停止") else: self.update_status("图片检测完成") def save_result(self): if not hasattr(self, 'last_detection_result') or self.last_detection_result is None: QMessageBox.warning(self, "警告", "没有可保存的检测结果") return save_dir = "results" os.makedirs(save_dir, exist_ok=True) timestamp = time.strftime("%Y%m%d_%H%M%S") if self.is_camera_running or self.is_video_running: # 保存当前帧为图片 save_path = os.path.join(save_dir, f"snapshot_{timestamp}.jpg") cv2.imwrite(save_path, cv2.cvtColor(self.last_detection_result, cv2.COLOR_RGB2BGR)) self.update_status(f"截图已保存: {save_path}") else: # 保存图片检测结果 save_path = os.path.join(save_dir, f"result_{timestamp}.jpg") cv2.imwrite(save_path, cv2.cvtColor(self.last_detection_result, cv2.COLOR_RGB2BGR)) self.update_status(f"检测结果已保存: {save_path}") def closeEvent(self, event): self.stop_detection() event.accept() if __name__ == "__main__": app = QApplication(sys.argv) # 设置应用程序样式 app.setStyle("Fusion") # 创建并显示主窗口 window = MainWindow() window.show() sys.exit(app.exec_())七、项目源码(视频下方简介内)
完整全部资源文件(包括测试图片、视频,py文件,训练数据集、训练代码、界面代码等),这里已打包上传至博主的面包多平台,见可参考博客与视频,已将所有涉及的文件同时打包到里面,点击即可运行,完整文件截图如下:
基于深度学习YOLOv10的工地运输车识别检测系统(YOLOv10+YOLO数据集+UI界面+Python项目源码+模型) ————————————————_哔哩哔哩_bilibili
基于深度学习YOLOv10的工地运输车识别检测系统(YOLOv10+YOLO数据集+UI界面+Python项目源码+模型) ————————————————