基于YOLOv5与OpenCV的钢筋智能计数技术实践

今忱

1. 项目背景与核心价值

钢筋计数是建筑工地和钢材加工厂日常作业中的高频需求。传统人工计数方式效率低下且容易出错，特别是在大批量钢筋捆扎或堆放场景下。我曾参与过某大型基建项目的材料验收环节，亲眼目睹过工人们蹲在钢筋堆旁一根根清点的场景——不仅耗时费力（平均每捆需要3-5分钟），而且在光线不佳或钢筋密集时，计数准确率会骤降至80%以下。

计算机视觉技术的引入彻底改变了这一局面。通过YOLOv5+OpenCV的组合方案，我们实现了单帧图像0.2秒完成200根钢筋的自动计数，准确率稳定在98%以上。这套系统在深圳某地铁建设项目中部署后，材料进场验收效率提升了17倍，每年节省人工成本约43万元。

2. 技术方案选型与对比

2.1 传统图像处理方法

早期尝试过基于霍夫变换的直线检测方案：

python复制import cv2
gray = cv2.cvtColor(img, cv2.COLOR_BGR2GRAY)
edges = cv2.Canny(gray, 50, 150)
lines = cv2.HoughLinesP(edges, 1, np.pi/180, threshold=100, 
                        minLineLength=50, maxLineGap=10)

但实际测试发现三个致命缺陷：

钢筋表面纹理会导致误检（将一根钢筋识别为多段）
交叉钢筋的接点处会被重复计数
光照变化对检测效果影响极大

2.2 深度学习方案迭代

经过对比测试不同模型的表现：

模型	推理速度(ms)	mAP@0.5	显存占用(MB)
Faster R-CNN	120	0.89	2100
SSD300	45	0.82	850
YOLOv5s	22	0.91	680
YOLOv5m	38	0.94	1100

最终选择YOLOv5m作为基础模型，在准确率和速度间取得最佳平衡。针对钢筋场景做了三项关键改进：

修改anchor box尺寸匹配钢筋长宽比（默认anchor不适合细长物体）
添加高斯热图分支辅助密集钢筋定位
采用DIoU-NMS替代传统NMS解决交叉钢筋问题

3. 数据采集与标注规范

3.1 现场采集要点

拍摄角度：保持镜头轴线与钢筋堆表面垂直（角度偏差<15°）
光照条件：避免强反光（最佳时段为上午9-11点）
拍摄距离：每根钢筋在图像中宽度应≥8像素
背景处理：铺设纯色帆布可提升20%检测精度

3.2 标注标准示例

采用LabelImg工具标注时需遵循：

xml复制<object>
  <name>rebar</name>
  <bndbox>
    <xmin>256</xmin>
    <ymin>189</ymin>
    <xmax>278</xmax>
    <ymax>423</ymax>
  </bndbox>
  <attribute>horizontal</attribute>
</object>

关键属性标注要求：

必须完整框住钢筋可见部分
交叉钢筋按实际可见段分别标注
添加orientation属性区分水平/垂直走向

4. 模型训练与优化技巧

4.1 数据增强策略

python复制# albumentations增强管道示例
transform = A.Compose([
    A.RandomBrightnessContrast(p=0.5),
    A.GridDistortion(p=0.3),
    A.Rotate(limit=15, p=0.5),
    A.Cutout(num_holes=8, max_h_size=16, 
             max_w_size=16, p=0.3)
])

特别有效的增强方式：

网格畸变模拟钢筋弯曲
随机遮挡模拟堆叠情况
有限角度旋转（避免破坏钢筋走向特征）

4.2 损失函数改进

原始CIoU损失在密集钢筋场景表现不佳，改用：

python复制def rebar_loss(pred, target):
    ciou = bbox_iou(pred, target, CIoU=True)
    angle_loss = 1 - torch.cos(pred[:, 4] - target[:, 4])
    return 0.8*ciou + 0.2*angle_loss

通过添加角度约束项，使模型对钢筋方向更加敏感。

5. 部署落地关键问题

5.1 边缘设备优化

在Jetson Xavier NX上的优化步骤：

转换TensorRT引擎：

bash复制python export.py --weights best.pt --include engine --device 0 --half

启用DLA核心：

python复制trt.init_dla(0, dla_core=1)

量化INT8精度损失仅2%，速度提升3.1倍

5.2 动态计数算法

针对视频流的处理逻辑：

python复制class RebarCounter:
    def __init__(self):
        self.tracker = StrongSORT()
        self.count_dict = defaultdict(int)
    
    def process_frame(self, detections):
        tracks = self.tracker.update(detections)
        for track in tracks:
            if not track.is_counted and track.conf > 0.7:
                self.count_dict[track.cls] += 1
                track.mark_counted()
        return self.count_dict

采用StrongSORT实现跨帧追踪，避免重复计数。

6. 实测性能与误差分析

在某钢材仓库的测试数据：

场景	数量(根)	检测结果	误差率
单层平铺	152	150	-1.3%
双层交叉	208	211	+1.4%
带锈蚀表面	175	173	-1.1%
雨中拍摄	190	182	-4.2%

主要误差来源分析：

雨水在钢筋表面形成反光膜（可通过偏振镜缓解）
深层钢筋被完全遮挡（需要多角度拍摄补充）
严重锈蚀导致纹理特征改变（需扩充训练数据）

7. 工程实践建议

现场部署三件套：
- 工业相机：Basler ace 2（全局快门）
- 补光系统：环形LED阵列（色温5500K）
- 计算单元：Jetson AGX Orin（32GB版本）
计数结果校验机制：

python复制def validate_count(current, history):
    mad = np.median(np.abs(history - np.median(history)))
    if abs(current - np.median(history)) > 3*mad:
        trigger_manual_check()

基于历史数据中位数绝对偏差实现异常值自动预警。

长期维护策略：

每月更新200张新场景图片到训练集
采用主动学习策略自动筛选困难样本
建立钢筋型号数据库辅助型号识别

已经到底了哦