基于Luxonis OAK的智能车牌检测系统开发指南

王端端

1. 项目概述：基于Luxonis OAK的智能车牌检测系统开发

在智能交通和安防监控领域，车牌自动识别（LPR）技术已经发展得相当成熟。但传统方案往往依赖高性能服务器或工控机，而Luxonis OAK系列边缘计算设备通过将深度学习模型直接部署到嵌入式视觉模块，实现了低功耗、高并发的实时识别能力。这个项目将带您完成从数据准备到模型部署的全流程，最终在OAK设备上运行一个能实时检测车牌的轻量化AI应用。

我选择OAK平台主要基于三个优势：首先是其独特的神经计算棒架构，能在1-2W功耗下实现4TOPS算力；其次是内置的深度感知相机支持双目测距，这对车牌定位很有帮助；最重要的是OpenVINO工具链对模型优化的支持，能让YOLO这类检测模型在资源受限环境下保持高帧率。

2. 核心组件与技术选型

2.1 硬件设备选型建议

Luxonis OAK产品线包含多个型号，对于车牌检测推荐：

OAK-D Lite：性价比之选，400万像素RGB相机+双目深度，适合固定角度安装
OAK-D Pro：全局快门相机，适合高速移动车辆场景
OAK-1：单目方案，适合预算有限的基础项目

关键参数对比：

型号相机配置深度能力价格区间

OAK-D Lite 4MP RGB + 双目支持 $199

OAK-D Pro 12MP全局快门+双目支持 $399

OAK-1 4MP RGB 不支持 $99

型号	相机配置	深度能力	价格区间
OAK-D Lite	4MP RGB + 双目	支持	$199
OAK-D Pro	12MP全局快门+双目	支持	$399
OAK-1	4MP RGB	不支持	$99

2.2 软件工具链搭建

开发环境需要以下组件协同工作：

OpenVINO Toolkit：2022.3以上版本，用于模型优化和量化
DepthAI API：2.0+版本，OAK设备通信的核心库
LabelImg：标注工具，建议使用改进版labelImg2
Roboflow：在线数据增强平台（可选但推荐）

安装基础环境的命令如下：

bash复制# 创建Python虚拟环境
python -m venv oak_lpr
source oak_lpr/bin/activate

# 安装核心依赖
pip install depthai openvino-dev==2022.3.0 numpy opencv-python

3. 数据集准备与增强策略

3.1 数据采集要点

优质的车牌检测数据集需要覆盖：

多角度拍摄：俯仰角±30度范围内样本
光照变化：包含白天、夜间、逆光等场景
车牌类型：不同国家的车牌样式（如果涉及跨境场景）
遮挡情况：部分遮挡车牌样本占比约15%

建议使用OAK设备直接采集原始数据，这样能保证输入数据与最终部署环境的一致性。通过DepthAI的录制功能可以轻松创建数据集：

python复制import depthai as dai

pipeline = dai.Pipeline()
cam = pipeline.create(dai.node.ColorCamera)
xout = pipeline.create(dai.node.XLinkOut)
xout.setStreamName("video")
cam.video.link(xout.input)

with dai.Device(pipeline) as device:
    q = device.getOutputQueue("video")
    while True:
        frame = q.get().getCvFrame()
        cv2.imshow("Recording", frame)
        if cv2.waitKey(1) == ord('s'):
            cv2.imwrite(f"plate_{time.time()}.jpg", frame)

3.2 数据标注规范

使用LabelImg进行标注时需注意：

标签统一为"license_plate"
边界框应紧贴车牌字符区域（不包括边框装饰）
对于倾斜车牌使用旋转矩形标注（需升级到LabelImg2）
标注文件保存为YOLO格式的txt文件

标注文件示例：

code复制0 0.543 0.612 0.125 0.048  # class x_center y_center width height

3.3 数据增强方案

通过Roboflow应用以下增强组合效果最佳：

基础增强：90/180/270度旋转、水平翻转
色彩扰动：饱和度±20%、亮度±15%、对比度±10%
几何变形：透视变换（最大倾斜20度）
环境模拟：添加雨滴、镜头污渍等噪声

增强后的数据集应达到3000+样本量，各类增强样本比例建议：

原始样本：40%
几何变换：30%
光照变化：20%
遮挡模拟：10%

4. 模型训练与优化

4.1 模型架构选择

对比测试显示，在OAK设备上表现最好的模型架构：

YOLOv5n：最快（23FPS@OAK-D），精度尚可
YOLOv6n：平衡之选（18FPS，mAP@0.5 0.89）
NanoDet：超轻量（32FPS），适合低分辨率场景

推荐使用YOLOv6的Nano版本，其结构优化更适合边缘设备：

python复制# yolov6n_backbone.yaml
depth_multiple: 0.33
width_multiple: 0.25
backbone:
  [[-1, 1, Conv, [64, 6, 2, 2]],  # 0-P1/2
   [-1, 1, Conv, [128, 3, 2]],    # 1-P2/4
   [-1, 3, C3, [128]],
   [-1, 1, Conv, [256, 3, 2]],    # 3-P3/8
   [-1, 6, C3, [256]],
   [-1, 1, Conv, [512, 3, 2]],    # 5-P4/16
   [-1, 9, C3, [512]],
   [-1, 1, Conv, [1024, 3, 2]],   # 7-P5/32
   [-1, 3, C3, [1024]],
   [-1, 1, SPPF, [1024, 5]],      # 9
  ]

4.2 训练参数配置

关键训练参数设置建议：

yaml复制# hyp.yaml
lr0: 0.01            # 初始学习率
lrf: 0.01            # 最终学习率
momentum: 0.937      # SGD动量
weight_decay: 0.0005 # 权重衰减
warmup_epochs: 3.0   # 热身训练轮数
batch_size: 64       # 根据GPU显存调整

启动训练命令：

bash复制python train.py --batch 64 --epochs 100 --data plate_data.yaml --cfg yolov6n.yaml --weights '' --device 0 --hyp hyp.yaml

4.3 模型量化与优化

使用OpenVINO进行INT8量化的关键步骤：

导出ONNX模型：

bash复制python export_onnx.py --weights runs/train/exp/weights/best.pt --simplify

运行量化：

bash复制pot -q default -m best.onnx -w best.onnx --ac config.yaml

量化配置文件示例：

yaml复制# config.yaml
model:
  model_name: plate_detector
  model: best.onnx
  weights: best.onnx

engine:
  type: accuracy_checker
  config: accuracy_checker_config.yaml

compression:
  - algorithm: quantization
    preset: performance
    target_device: CPU

5. 部署到OAK设备

5.1 模型转换与封装

将优化后的模型转换为OAK可用的blob格式：

bash复制python3 /opt/intel/openvino/deployment_tools/model_optimizer/mo.py \
--input_model best_int8.xml \
--output_dir ./blob \
--data_type FP16 \
--scale 255 \
--reverse_input_channels

然后使用DepthAI的编译工具生成blob文件：

bash复制./compile_model.sh -m best_int8.xml -o plate_detector.blob -sh 320 -sw 320

5.2 部署代码实现

完整的车牌检测Pipeline实现：

python复制import depthai as dai
import cv2

pipeline = dai.Pipeline()

# 定义神经网络节点
detection_nn = pipeline.create(dai.node.NeuralNetwork)
detection_nn.setBlobPath("plate_detector.blob")

# 配置摄像头
cam = pipeline.create(dai.node.ColorCamera)
cam.setPreviewSize(320, 320)
cam.setInterleaved(False)
cam.setColorOrder(dai.ColorCameraProperties.ColorOrder.BGR)

# 创建输出
xout_nn = pipeline.create(dai.node.XLinkOut)
xout_nn.setStreamName("nn")
xout_frame = pipeline.create(dai.node.XLinkOut)
xout_frame.setStreamName("frame")

# 连接节点
cam.preview.link(detection_nn.input)
detection_nn.out.link(xout_nn.input)
cam.preview.link(xout_frame.input)

# 设备连接与处理
with dai.Device(pipeline) as device:
    q_nn = device.getOutputQueue("nn")
    q_frame = device.getOutputQueue("frame")

    while True:
        in_frame = q_frame.get().getCvFrame()
        in_nn = q_nn.get()

        detections = in_nn.detections
        for detection in detections:
            bbox = detection.boundingBox
            x1 = int(bbox.xmin * in_frame.shape[1])
            y1 = int(bbox.ymin * in_frame.shape[0])
            x2 = int(bbox.xmax * in_frame.shape[1])
            y2 = int(bbox.ymax * in_frame.shape[0])

            cv2.rectangle(in_frame, (x1,y1), (x2,y2), (0,255,0), 2)
        
        cv2.imshow("Plate Detection", in_frame)
        if cv2.waitKey(1) == ord('q'):
            break

5.3 性能优化技巧

帧率提升方案：
- 将模型输入分辨率降至320x320
- 使用OAK的硬件加速图像预处理（缩放/归一化）
- 启用DepthAI的NN多线程推理
精度优化方案：
- 在模型后处理中添加NMS（非极大值抑制）
- 对连续帧检测结果进行滑动平均
- 利用深度信息过滤地面等干扰区域
内存优化：
- 使用-sh/-sw参数匹配模型输入尺寸
- 关闭不需要的传感器数据流
- 将模型拆分为多个小blob文件

6. 实际应用与问题排查

6.1 典型应用场景配置

收费站场景：

python复制# 配置适合收费站的高角度拍摄
cam.setBoardSocket(dai.CameraBoardSocket.RGB)
cam.setResolution(dai.ColorCameraProperties.SensorResolution.THE_1080_P)
cam.setPreviewSize(640, 360)  # 16:9比例
cam.setFps(25)

停车场场景：

python复制# 低光照环境配置
cam.setIspScale(1,3)  # 启用数字变焦
cam.setManualFocus(80) # 固定焦距
cam.setBrightness(2)   # 提高亮度

6.2 常见问题解决方案

检测漏报问题：

检查训练数据是否包含类似漏检的样本
尝试降低检测置信度阈值（从0.5调到0.3）
增加测试时的图像锐化预处理

误检问题处理：

在数据集添加更多负样本（非车牌区域）
后处理中添加长宽比过滤（车牌通常为3:1比例）
利用深度信息排除远处小物体

性能下降排查：

bash复制# 监控设备状态
depthai_viewer -s all

检查指标：

温度（应<65℃）
DDR内存使用率（应<80%）
NN计算延迟（应<50ms）

6.3 进阶扩展方向

车牌识别一体化：
添加OCR模型分支，实现检测识别端到端方案

python复制# 在YOLO尾部添加识别头
[[-1, 1, Conv, [128, 1, 1]],
 [-1, 1, nn.Upsample, [None, 2, 'nearest']],
 [[-1, 6], 1, Concat, [1]],
 [-1, 3, C3, [128, False]],
 [-1, 1, Conv, [78, 1, 1]]]  # 78=26字母+10数字+各省缩写