YOLOv8车辆行人检测系统实战：从训练到部署

FoxNewsAI

1. 项目概述：YOLOv8车辆行人检测系统实战

去年我在参与一个智慧园区项目时，遇到了一个棘手的问题：需要实时监控园区内车辆和行人的流动情况。传统方案要么准确率不足，要么延迟太高。经过多次技术选型，最终基于YOLOv8构建的检测系统完美解决了这个问题。今天我就把这个经过实战检验的方案完整分享给大家。

这个系统最突出的特点是：

采用最新的YOLOv8s模型，在5607张标注数据上训练
支持图片、视频和摄像头实时检测三种模式
提供直观的PyQt5图形界面，可动态调整检测参数
平均检测速度达到45FPS（RTX 3060显卡）
对遮挡目标和小目标有专门优化

2. 环境配置与数据准备

2.1 开发环境搭建

推荐使用Anaconda创建隔离的Python环境：

bash复制conda create -n yolov8 python=3.9 -y
conda activate yolov8
pip install torch torchvision torchaudio
pip install ultralytics opencv-python pyqt5

注意：如果使用GPU加速，需要安装对应版本的CUDA和cuDNN。建议使用PyTorch官方提供的预编译版本。

2.2 数据集详解

我们的数据集包含5607张标注图像，主要来自三个渠道：

公开数据集（COCO、Cityscapes）筛选出的相关场景
自行采集的监控摄像头画面
行车记录仪和无人机拍摄素材

数据集特点：

包含白天/夜间多种光照条件
覆盖城市道路、停车场等10+场景
标注经过三级质检流程审核
使用Mosaic和MixUp等增强技术

数据集目录结构：

code复制dataset/
├── images/
│   ├── train/  # 4485张
│   └── val/    # 1122张
└── labels/
    ├── train/
    └── val/

3. 模型训练与优化

3.1 训练配置

使用YOLOv8s预训练模型进行迁移学习：

python复制from ultralytics import YOLO

model = YOLO('yolov8s.pt')  # 加载预训练模型
results = model.train(
    data='data.yaml',
    epochs=300,
    batch=64,
    imgsz=640,
    device='0',  # 使用GPU
    workers=8,
    optimizer='AdamW',
    lr0=0.001,
)

关键训练参数说明：

imgsz=640：输入图像缩放尺寸
optimizer='AdamW'：使用AdamW优化器
cos_lr=True：启用余弦学习率调度
fliplr=0.5：水平翻转增强概率

3.2 数据增强策略

我们在训练中采用了多阶段增强方案：

基础增强：

yaml复制augmentations:
  - hsv_h: 0.015  # 色相增强
  - hsv_s: 0.7    # 饱和度增强
  - hsv_v: 0.4    # 明度增强
  - translate: 0.1  # 平移
  - scale: 0.5     # 缩放

高级增强：

Mosaic：四图拼接增强小目标检测
MixUp：两图混合提升模型鲁棒性
随机遮挡：模拟真实场景中的遮挡情况

3.3 模型评估指标

在验证集上的表现：

指标	行人(mAP@0.5)	车辆(mAP@0.5)	综合
精确率	89.2%	92.7%	91.0%
召回率	86.5%	90.3%	88.4%
推理速度	45 FPS	45 FPS	45 FPS

实测发现，夜间场景的检测准确率比白天低约5-8%，这是后续需要重点优化的方向。

4. 系统实现与核心代码

4.1 系统架构设计

整个系统采用模块化设计：

code复制src/
├── core/            # 核心检测逻辑
│   ├── detector.py  # YOLOv8封装
│   └── utils.py     # 工具函数
├── ui/              # 界面相关
│   ├── main.ui      # Qt Designer文件
│   └── ui_main.py   # 生成界面代码
└── app.py           # 主程序入口

4.2 检测核心逻辑

detector.py的关键实现：

python复制class YOLODetector:
    def __init__(self, model_path):
        self.model = YOLO(model_path)
        self.class_names = ['person', 'car']
        
    def detect(self, img, conf_thres=0.25, iou_thres=0.45):
        """执行目标检测"""
        results = self.model.predict(
            source=img,
            conf=conf_thres,
            iou=iou_thres,
            classes=[0, 2],  # 只检测行人和车辆
            verbose=False
        )
        
        # 解析检测结果
        detections = []
        for result in results:
            for box in result.boxes:
                x1, y1, x2, y2 = map(int, box.xyxy[0].tolist())
                conf = float(box.conf[0])
                cls = int(box.cls[0])
                detections.append({
                    'class': self.class_names[cls],
                    'confidence': conf,
                    'bbox': [x1, y1, x2, y2]
                })
        
        return detections, results[0].plot()

4.3 多线程处理

为提高实时性，我们采用生产者-消费者模式：

python复制from queue import Queue
from threading import Thread

class VideoProcessor:
    def __init__(self):
        self.frame_queue = Queue(maxsize=30)
        self.result_queue = Queue(maxsize=30)
        
    def start(self):
        self.producer_thread = Thread(target=self._produce)
        self.consumer_thread = Thread(target=self._consume)
        self.producer_thread.start()
        self.consumer_thread.start()
        
    def _produce(self):
        while self.running:
            ret, frame = self.cap.read()
            if ret:
                self.frame_queue.put(frame)
                
    def _consume(self):
        while self.running:
            frame = self.frame_queue.get()
            results = self.detector.detect(frame)
            self.result_queue.put(results)

5. 图形界面实现

5.1 UI设计要点

使用PyQt5实现的主要功能：

模型动态加载与切换
实时参数调整（置信度/IoU阈值）
检测结果可视化展示
检测数据统计表格
结果保存功能

界面布局采用左右分栏设计：

左侧：图像显示区域（原始图像/检测结果）
右侧：控制面板（参数设置/功能按钮）

5.2 关键交互逻辑

摄像头检测的核心流程：

python复制def start_camera(self):
    self.cap = cv2.VideoCapture(0)  # 打开默认摄像头
    self.timer = QTimer()
    self.timer.timeout.connect(self.update_frame)
    self.timer.start(30)  # 30ms间隔
    
def update_frame(self):
    ret, frame = self.cap.read()
    if ret:
        # 转换颜色空间
        rgb_img = cv2.cvtColor(frame, cv2.COLOR_BGR2RGB)
        
        # 执行检测
        conf = self.conf_slider.value() / 100
        iou = self.iou_slider.value() / 100
        results = self.detector.detect(rgb_img, conf, iou)
        
        # 显示结果
        self.display_image(results[1], self.result_label)