基于YOLOv5的零售货架智能缺货检测系统实践

Diane Lockhart

1. 项目概述

零售货架商品缺货是个长期困扰行业的痛点。传统人工巡检方式效率低下，大型商超完成一次全店巡检往往需要4-6小时，等发现缺货时可能已经错过了最佳补货时机。我们团队通过计算机视觉技术实现的自动化货架可用性监测系统，将这一过程缩短到分钟级，缺货识别准确率达到97%以上。

这个方案的核心在于将普通的安防摄像头改造成智能感知终端。通过部署在货架上方的摄像头采集图像，利用YOLOv5模型实时检测商品位置和库存状态，当某商品连续3帧未被检测到即触发缺货预警。相比RFID等方案，我们的视觉方案无需改造商品包装，单店改造成本可控制在2万元以内。

2. 技术架构解析

2.1 硬件部署方案

我们推荐采用海康威视4K星光级摄像头（如DS-2CD2087G2-L）以30°俯角安装在货架上方2.5米处，每个摄像头可覆盖8-10米长的货架区域。关键参数配置：

分辨率：3840×2160 @15fps
光圈：F1.6
补光灯：850nm红外（避免影响顾客体验）

注意：安装时要避开顶棚射灯直射区域，避免镜面反光影响识别效果。我们曾在某便利店因射灯干扰导致识别率下降40%，调整角度后恢复正常。

2.2 算法模型选型

经过对比测试，YOLOv5s在速度和精度上达到最佳平衡：

输入尺寸：640×640
mAP@0.5：0.89
推理速度：22ms/帧（NVIDIA Jetson Xavier NX）
模型大小：14.3MB

训练数据需包含：

各时段光照条件（早/中/晚）
不同陈列状态（满架/缺货/错位）
顾客遮挡场景
促销标牌干扰

我们在某连锁超市采集了超过15万张标注图像，涵盖2000+SKU。数据增强策略包括：

随机亮度（±30%）
模拟货架反光
人工遮挡合成

3. 核心算法实现

3.1 商品检测流程

python复制def detect_out_of_stock(frame):
    # 图像预处理
    img = cv2.cvtColor(frame, cv2.COLOR_BGR2RGB)
    img = letterbox(img, new_shape=640)[0]
    
    # 推理
    pred = model(img, augment=False)[0]
    
    # 后处理
    pred = non_max_suppression(pred, conf_thres=0.6, iou_thres=0.5)
    
    # 缺货判断
    for det in pred:
        if len(det) == 0:
            update_missing_counter(shelf_id)

3.2 缺货判定逻辑

我们采用三级确认机制降低误报：

单帧检测：置信度>0.6的检测结果
时序验证：连续3帧未检测到
空间校验：相邻同款商品是否存在

缺货判定公式：

code复制缺货概率 = 1 - ∏(1 - p_i)  (i=1→3)
其中p_i为各层级置信度

4. 系统集成方案

4.1 实时告警配置

通过MQTT协议将告警信息推送到门店PDA：

json复制{
  "timestamp": "2023-07-15T14:32:18",
  "shelf_id": "A12-3",
  "sku": "6928804010165",
  "confidence": 0.92,
  "last_seen": "2023-07-15T14:28:05",
  "image_url": "http://cdn.example.com/alert_A12-3_20230715143218.jpg"
}

4.2 性能优化技巧

区域检测：只处理货架ROI区域，减少60%计算量
动态采样：闲时5fps，高峰时段15fps
模型蒸馏：将YOLOv5s压缩至8.7MB，速度提升35%

5. 落地挑战与解决方案

5.1 典型问题排查

问题现象	可能原因	解决方案
新品识别率低	未包含在训练集	在线增量学习
夜间误报多	红外反光干扰	调整补光角度
促销期漏检	价格牌遮挡	添加促销标牌样本