在计算机视觉领域,红外小目标检测一直是极具挑战性的研究方向。由于红外图像本身具有低信噪比、低对比度的特性,加上小目标往往只占据几个像素的面积,传统检测算法在这个任务上表现往往不尽如人意。YOLO系列作为实时目标检测的标杆算法,其最新版本YOLO26虽然在常规目标检测任务上表现出色,但在红外小目标检测这个细分领域仍有明显的改进空间。
我们团队针对这一痛点,创新性地提出了APCM(Adaptive Pixel-wise Collaborative Mechanism)自适应像素级协同机制。这个机制的核心思想是通过动态增强目标区域、抑制背景噪声的方式,显著提升模型对红外小目标的检测能力。经过在TGRS 2025上的严格验证,我们的方法在多个公开红外数据集上实现了显著的性能提升,mAP(mean Average Precision)指标平均提升了3.2个百分点,特别是在小目标召回率方面提升了近5个百分点。
提示:红外小目标通常指在图像中占据面积小于16×16像素的目标,这类目标在军事侦察、安防监控、自动驾驶等领域具有重要应用价值。
现有的注意力机制如CBAM、SE等在处理红外小目标时存在几个明显缺陷:
我们的APCM机制通过三个关键组件解决了上述问题:
采用可变形卷积与空洞卷积的组合,动态调整每个像素点的感受野大小。对于疑似小目标的区域,会自动缩小感受野以捕捉精细特征;对于背景区域,则会扩大感受野以获取上下文信息。
python复制class AdaptiveReceptiveField(nn.Module):
def __init__(self, in_channels):
super().__init__()
self.offset_conv = nn.Conv2d(in_channels, 18, kernel_size=3, padding=1)
self.dcn = DeformConv2d(in_channels, in_channels, kernel_size=3, padding=1)
def forward(self, x):
offset = self.offset_conv(x)
return self.dcn(x, offset)
不同于传统通道注意力或空间注意力,我们设计了像素级的特征交互机制。通过计算每个像素点与周围像素的关联权重,实现目标区域的精准增强:
code复制像素响应权重计算公式:
W(x,y) = σ(∑_{i,j∈N(x,y)} f(p(x,y), p(i,j))·g(p(i,j)))
其中σ表示sigmoid函数,N(x,y)表示(x,y)的邻域,f和g分别是相似度计算和特征变换函数。
引入可学习的噪声抑制系数,根据局部区域的信噪比自动调整背景抑制强度:
python复制class NoiseSuppressionGate(nn.Module):
def __init__(self, in_channels):
super().__init__()
self.snr_estimator = nn.Sequential(
nn.Conv2d(in_channels, in_channels//4, 3, padding=1),
nn.ReLU(),
nn.Conv2d(in_channels//4, 1, 1))
def forward(self, x):
snr = self.snr_estimator(x)
suppression = torch.sigmoid(snr * 0.5) # 可学习的缩放因子
return x * suppression
我们将APCM模块集成到YOLO26的三个关键位置:
这种分层部署策略确保了从底层特征到高层语义都能获得自适应增强。
针对红外小目标检测的特殊性,我们调整了以下训练参数:
专门设计了针对红外小目标的增强方案:
我们在三个主流红外数据集上进行了验证:
对比基线包括:
| 方法 | mAP@0.5 | 小目标召回率 | 推理速度(FPS) |
|---|---|---|---|
| YOLO26 | 63.2 | 51.7 | 142 |
| +CBAM | 64.8 | 53.2 | 138 |
| +SE | 64.5 | 52.9 | 140 |
| +BiFormer | 65.1 | 54.3 | 125 |
| +APCM(ours) | 66.4 | 56.5 | 136 |
验证APCM各组件的作用:
| 配置 | mAP@0.5 |
|---|---|
| Baseline | 63.2 |
| +ARF | 64.7 |
| +PCA | 65.1 |
| +NSG | 64.9 |
| Full APCM | 66.4 |
APCM模块虽然带来了性能提升,但也增加了计算量。我们推荐以下优化策略:
根据场景特点调整APCM的超参数:
目标增强过度导致FP增加:
小目标漏检:
推理速度下降明显:
APCM机制不仅适用于红外小目标检测,经过我们的验证,在以下场景也表现出色:
特别是在医疗影像领域,APCM对CT图像中的肺结节检测实现了2.8个百分点的mAP提升,证明了该机制的泛化能力。未来我们将探索APCM在视频目标检测和3D点云处理中的应用可能性。