新疆维吾尔自治区网站建设_网站建设公司_Python

YOLO-v5代码实例：加载自定义图片进行推理的详细步骤

YOLO（You Only Look Once）是一种流行的物体检测和图像分割模型，由华盛顿大学的Joseph Redmon 和Ali Farhadi 开发。 YOLO 于2015 年推出，因其高速和高精度而广受欢迎。经过多个版本迭代，YOLOv5 在保持实时性的同时进一步提升了检测精度与易用性，成为工业界和学术界广泛应用的目标检测解决方案之一。

基于YOLOv5算法构建的深度学习镜像，提供了完整的计算机视觉开发环境。该镜像预装了PyTorch深度学习框架及YOLOv5专用工具库，支持目标检测任务的快速开发与部署。本文将详细介绍如何使用该镜像加载自定义本地图片并执行推理，涵盖环境准备、代码实现、结果处理等关键环节，帮助开发者快速上手YOLOv5的实际应用。

1. 环境与资源准备

在开始推理之前，确保已正确配置YOLOv5运行环境。本节介绍两种常见使用方式：Jupyter Notebook 和 SSH 远程访问，并说明项目目录结构。

1.1 使用 Jupyter Notebook

Jupyter 是交互式开发的理想选择，特别适合调试和可视化。启动容器后，可通过浏览器访问 Jupyter 页面：

打开浏览器，输入提供的 URL 地址
导航至/root/yolov5/目录
创建新的.ipynb文件或打开已有示例 notebook

1.2 使用 SSH 方式连接

对于需要长期运行或批量处理的任务，推荐通过 SSH 登录服务器进行操作：

使用终端执行ssh root@<your-server-ip>进行连接
输入密码后进入系统
可直接运行 Python 脚本或启动后台任务

1.3 项目路径与依赖确认

首先进入 YOLOv5 主目录：

cd /root/yolov5/

该目录包含以下核心组件：

models/：模型定义文件（如 yolov5s.yaml）
utils/：通用工具函数（绘图、数据增强等）
detect.py：标准推理脚本
requirements.txt：所需 Python 包列表

所有依赖均已预安装，无需额外配置即可调用torch.hub.load加载模型。

2. 模型加载与图像输入设置

本节将演示如何从 Hub 加载预训练 YOLOv5 模型，并准备自定义图像作为输入源。

2.1 加载 YOLOv5 预训练模型

YOLOv5 提供多种尺寸模型以适应不同硬件条件和性能需求：

模型	参数量（M）	推理速度（FPS）	适用场景
yolov5n	1.9	~160	边缘设备、低延迟要求
yolov5s	7.2	~90	平衡精度与速度
yolov5m	21.2	~50	中等算力平台
yolov5l	46.5	~30	高精度需求
yolov5x	86.7	~18	最高精度

默认推荐使用yolov5s，兼顾效率与准确性：

import torch # Load a YOLOv5 model (options: yolov5n, yolov5s, yolov5m, yolov5l, yolov5x) model = torch.hub.load("ultralytics/yolov5", "yolov5s") # Default: yolov5s

首次运行时会自动下载权重文件（约 140MB），后续调用将直接从缓存加载。

2.2 设置自定义图像输入

YOLOv5 支持多种图像输入格式，包括：

网络图片 URL
本地文件路径（.jpg,.png等）
PIL 图像对象
OpenCV 的 numpy 数组（BGR 格式）
多图列表（用于批量推理）

示例：加载本地图片

假设你有一张名为custom_image.jpg的图片上传至/root/yolov5/data/images/目录下：

img = "/root/yolov5/data/images/custom_image.jpg"

若目录不存在可手动创建：

mkdir -p /root/yolov5/data/images # 将图片上传至此目录

也可以使用 OpenCV 读取图像并传入模型：

import cv2 img_cv = cv2.imread("/root/yolov5/data/images/custom_image.jpg") results = model(img_cv) # 自动转换 BGR → RGB

3. 执行推理与结果解析

模型加载完成后，即可对输入图像执行端到端推理。YOLOv5 内部自动完成图像预处理（归一化、缩放、填充），用户无需手动干预。

3.1 执行推理并输出结果

# Perform inference results = model(img) # Print detection results to console results.print()

输出示例如下：

image 1/1 /root/yolov5/data/images/custom_image.jpg: 640x480 4 persons, 1 tie, Done. (0.023s)

表示检测到 4 个人和 1 条领带，推理耗时 23ms。

3.2 可视化检测结果

YOLOv5 提供便捷的可视化方法：

results.show() # 弹窗显示带框图像（需 GUI 环境）

注意：在无图形界面的服务器上运行时，show()可能报错。建议改用save()保存图像。

results.save() # 保存结果到 runs/detect/exp/

保存路径按时间戳递增命名（如exp,exp2），便于区分多次实验。

3.3 获取结构化检测数据

除了可视化，还可提取结构化结果用于后续分析：

# Convert to pandas DataFrame df = results.pandas().xyxy[0] # 第一张图的结果 print(df)

输出字段说明：

列名	含义
xmin, ymin	检测框左上角坐标
xmax, ymax	检测框右下角坐标
confidence	置信度分数（0~1）
name	类别名称（如 'person', 'car'）
class	类别索引（COCO 数据集共80类）

可用于过滤特定类别或高置信度结果：

# 提取所有人脸（假设类别为 'person' 且置信度 > 0.7） high_conf_persons = df[(df['name'] == 'person') & (df['confidence'] > 0.7)]

3.4 裁剪检测区域（Crop）

YOLOv5 支持一键裁剪出每个检测对象：

cropped_images = results.crop(save=True) # 保存裁剪后的图像

裁剪结果保存在runs/detect/exp/crops/<class_name>/目录下，适用于人脸识别、商品识别等子任务。

4. 完整代码示例与最佳实践

以下是整合上述步骤的完整可运行代码模板，适用于大多数自定义图像推理场景。

4.1 完整推理脚本

import torch import os from pathlib import Path # --- Step 1: Load Model --- model = torch.hub.load("ultralytics/yolov5", "yolov5s") # --- Step 2: Define Image Source --- img_path = "/root/yolov5/data/images/custom_image.jpg" # Check if file exists if not os.path.exists(img_path): raise FileNotFoundError(f"Image not found at {img_path}") # --- Step 3: Inference --- results = model(img_path) # --- Step 4: Process Results --- # Print to console results.print() # Save annotated image results.save() # Export cropped objects results.crop(save=True) # Get structured data df = results.pandas().xyxy[0] print("\nDetection Details:") print(df[['name', 'confidence', 'xmin', 'ymin', 'xmax', 'ymax']])

4.2 常见问题与解决方案

问题	原因	解决方案
`ModuleNotFoundError: No module named 'yolov5'`	路径未加入 PYTHONPATH	运行前执行`export PYTHONPATH="$PYTHONPATH:/root/yolov5"`
`cv2.imshow()`报错	无 GUI 环境	改用`results.save()`替代`show()`
推理结果为空	图像模糊或目标过小	尝试使用更大模型（如 yolov5m）或调整输入分辨率
下载模型失败	网络超时	手动下载权重并指定本地路径加载

4.3 性能优化建议

启用半精度（FP16）加速：

model = model.half().cuda() # GPU 上启用 float16 img_tensor = torch.half().cuda() # 输入也转为 half

调整图像大小以提升速度：

results = model(img, size=320) # 默认 640，降低可提速但影响精度

批量推理提高吞吐量：

img_list = ["img1.jpg", "img2.jpg", "img3.jpg"] results = model(img_list)

5. 总结

本文详细介绍了如何在 YOLOv5 深度学习镜像环境中加载自定义图片并执行目标检测推理。我们从环境搭建入手，逐步讲解了模型加载、图像输入设置、推理执行、结果解析与可视化等全流程操作，并提供了完整的可运行代码示例。

通过本教程，读者可以掌握以下核心技能：

正确使用torch.hub.load加载不同规模的 YOLOv5 模型；
灵活传入本地图片、OpenCV 图像等多种输入形式；
利用.print(),.save(),.crop()等方法高效处理检测结果；
提取结构化数据（pandas DataFrame）用于下游分析；
应对常见问题并进行性能优化。

YOLOv5 凭借其简洁的 API 设计和强大的功能集成，极大降低了目标检测技术的应用门槛。结合预置镜像环境，开发者可在几分钟内完成模型部署与测试，加速 AI 项目的落地进程。

获取更多AI镜像
想探索更多AI镜像和应用场景？访问 CSDN星图镜像广场，提供丰富的预置镜像，覆盖大模型推理、图像生成、视频生成、模型微调等多个领域，支持一键部署。

新疆维吾尔自治区网站建设_网站建设公司_Python_seo优化

YOLO-v5代码实例：加载自定义图片进行推理的详细步骤

1. 环境与资源准备

1.1 使用 Jupyter Notebook

1.2 使用 SSH 方式连接

1.3 项目路径与依赖确认

2. 模型加载与图像输入设置

2.1 加载 YOLOv5 预训练模型

2.2 设置自定义图像输入

示例：加载本地图片

3. 执行推理与结果解析

3.1 执行推理并输出结果

3.2 可视化检测结果

3.3 获取结构化检测数据

3.4 裁剪检测区域（Crop）

4. 完整代码示例与最佳实践

4.1 完整推理脚本

4.2 常见问题与解决方案

4.3 性能优化建议

5. 总结

热门文章

文章分类

标签云

需要专业的网站建设服务？

新疆维吾尔自治区网站建设_网站建设公司_Python_seo优化

YOLO-v5代码实例：加载自定义图片进行推理的详细步骤

1. 环境与资源准备

1.1 使用 Jupyter Notebook

1.2 使用 SSH 方式连接

1.3 项目路径与依赖确认

2. 模型加载与图像输入设置

2.1 加载 YOLOv5 预训练模型

2.2 设置自定义图像输入

示例：加载本地图片

3. 执行推理与结果解析

3.1 执行推理并输出结果

3.2 可视化检测结果

3.3 获取结构化检测数据

3.4 裁剪检测区域（Crop）

4. 完整代码示例与最佳实践

4.1 完整推理脚本

4.2 常见问题与解决方案

4.3 性能优化建议

5. 总结

热门文章

文章分类

标签云

相关文章

基于AutoGLM-Phone-9B的移动端AI实践｜视觉语音文本融合新体验

GLM-TTS社交应用：用户个性化语音消息生成器开发

团队协作提效方案：科哥UNet统一图片处理标准

需要专业的网站建设服务？