铜片划痕检测数据集与工业质检深度学习实践

2021在职mba

1. 铜片划痕识别数据集概述

这个1557张图像的数据集专门用于铜片表面划痕的三分类任务，包含['ng_gray','ok_gray','unk_gray']三个类别。作为工业质检领域的典型应用场景，这类数据集对于训练自动化缺陷检测模型具有重要价值。数据集采用224×224的低分辨率灰度图像，这种规格设计主要考虑工业场景中实时检测的硬件限制和计算效率。

从数据分布来看，三个类别的样本数量存在明显不均衡：ok_gray（合格品）占比最高达47.2%，ng_gray（不合格品）仅占18.1%，unk_gray（不确定状态）占34.7%。这种分布反映了实际产线中的真实情况——合格品通常占大多数。值得注意的是，数据集已预先划分为训练集（1245张）和验证集（312张），但没有提供独立的测试集，这意味着使用者需要自行划分或采用交叉验证策略。

2. 数据集结构与技术细节解析

2.1 文件组织架构

数据集采用经典的图像分类存储结构：

code复制dataset_root/
    ├── ng_gray/
    │   ├── 0001.jpg
    │   ├── 0002.jpg
    │   └── ...
    ├── ok_gray/
    │   ├── 0001.jpg 
    │   ├── 0002.jpg
    │   └── ...
    └── unk_gray/
        ├── 0001.jpg
        ├── 0002.jpg
        └── ...

这种目录结构兼容绝大多数深度学习框架（如PyTorch的ImageFolder和TensorFlow的image_dataset_from_directory），可以直接作为输入管道使用。每个子目录名称即类别标签，省去了单独的标注文件，这也是图像分类任务的常见做法。

2.2 图像规格分析

所有图像统一为224×224分辨率的灰度图，这种规格选择背后有几个技术考量：

工业摄像头通常以灰度模式采集图像，可以减少计算量并突出表面纹理特征
224×224是标准ImageNet尺寸，方便使用预训练模型
低分辨率有利于部署在边缘设备（如工业PLC）

但低分辨率也带来明显挑战——精细划痕可能只有几个像素宽度，这对模型的特征提取能力提出了更高要求。从示例图片可见，某些细微划痕在224×224分辨率下已呈现模糊状态，这可能导致模型难以学习到判别性特征。

3. 数据预处理与增强方案

3.1 基础预处理流程

针对本数据集特点，建议采用以下预处理步骤：

python复制import tensorflow as tf

def preprocess(image, label):
    # 归一化到[0,1]范围
    image = tf.image.convert_image_dtype(image, tf.float32)
    # 对比度增强（补偿低分辨率模糊问题）
    image = tf.image.random_contrast(image, lower=0.6, upper=1.4)
    # 添加轻微高斯噪声
    image = image + tf.random.normal(tf.shape(image), stddev=0.01)
    return image, label

3.2 针对性的数据增强

由于样本量有限且存在类别不平衡，需要设计特殊的数据增强策略：

对ng_gray类别重点应用旋转增强（0-360度），因为划痕方向不应影响分类
对ok_gray类别使用随机裁剪增强，增加表面纹理的多样性
对所有类别应用弹性变形（elastic transform），模拟材料形变情况

python复制# 示例：弹性变形实现
def elastic_transform(image, alpha=30, sigma=5):
    random_state = np.random.RandomState(None)
    shape = image.shape
    
    dx = gaussian_filter((random_state.rand(*shape) * 2 - 1), 
                        sigma, mode="constant") * alpha
    dy = gaussian_filter((random_state.rand(*shape) * 2 - 1), 
                        sigma, mode="constant") * alpha
    
    x, y = np.meshgrid(np.arange(shape[0]), np.arange(shape[1]))
    indices = np.reshape(y+dy, (-1, 1)), np.reshape(x+dx, (-1, 1))
    
    return map_coordinates(image, indices, order=1).reshape(shape)

4. 模型训练与调优建议

4.1 模型架构选择

考虑到小尺寸图像和工业检测需求，推荐以下架构方案：

轻量级CNN（如MobileNetV3）配合注意力机制
使用预训练模型的浅层特征（ResNet18的前三个block）
自定义的密集小卷积结构（kernel_size=3, stride=1）

一个有效的网络结构示例：

python复制model = Sequential([
    Conv2D(32, (3,3), activation='relu', input_shape=(224,224,1)),
    BatchNormalization(),
    Conv2D(32, (3,3), activation='relu'),
    MaxPooling2D((2,2)),
    
    Conv2D(64, (3,3), activation='relu'),
    BatchNormalization(),
    Conv2D(64, (3,3), activation='relu'),
    MaxPooling2D((2,2)),
    
    GlobalAveragePooling2D(),
    Dense(128, activation='relu'),
    Dropout(0.5),
    Dense(3, activation='softmax')
])

4.2 处理类别不平衡的策略

针对数据分布不均问题，可采用以下技术组合：

样本加权：根据类别频率设置损失权重

python复制class_weights = {
    0: len(ok_gray)/len(ng_gray),  # ng_gray
    1: 1.0,                        # ok_gray 
    2: len(ok_gray)/len(unk_gray)  # unk_gray
}

焦点损失（Focal Loss）调整难易样本权重
过采样（对ng_gray）与欠采样（对ok_gray）结合

5. 实际应用中的关键挑战

5.1 模糊图像的分类边界问题

从示例图片可见，unk_gray类别的判定存在主观性。在实际部署时，建议：

设置分类置信度阈值（如<0.7时触发人工复核）
对unk_gray样本进行二次细分（如unk-1到unk-5的置信度分级）
引入目标检测辅助定位可疑区域

5.2 产线适配注意事项

将训练好的模型部署到实际产线时需考虑：

光照一致性：建议在数据采集阶段使用同轴光源
摄像头校准：建立像素尺寸与实际尺寸的映射关系
实时性要求：224×224分辨率在Jetson Xavier上应能达到>30FPS

关键提示：工业场景中，unk_gray类别的处理策略直接影响产线效率。建议初期设置较高阈值，随着数据积累逐步调整。

6. 数据集的局限性与改进方向

当前数据集存在几个明显限制：

缺乏精确的划痕位置标注（无法支持检测任务）
分辨率过低导致细微缺陷识别困难
样本量不足（特别是ng_gray类别）
缺少不同光照条件下的样本变异

建议的改进方案：

采集更高分辨率（至少512×512）的原始图像
增加多角度光照条件下的样本
对ng_gray类别进行针对性补充采集
添加像素级标注（可通过半自动工具快速实现）

7. 扩展应用与迁移学习

虽然数据集针对铜片划痕设计，但其方法可推广到：

其他金属表面缺陷检测（铝板、钢板等）
类似纹理的工业品质检（塑料薄膜、纸张等）
通过迁移学习适配新材料

迁移学习实施步骤：

python复制base_model = ResNet50(weights='imagenet', include_top=False)
# 仅解冻最后两个卷积块
for layer in base_model.layers[:-10]:
    layer.trainable = False
    
# 添加自定义头部
x = GlobalAveragePooling2D()(base_model.output)
x = Dense(256, activation='relu')(x)
predictions = Dense(3, activation='softmax')(x)

8. 实操建议与经验分享

在实际项目中使用本数据集时，有几个关键经验值得分享：

数据清洗阶段应先去除明显错误标注的样本（如ok_gray中包含明显划痕的情况）
训练初期建议冻结大部分层，只训练最后的分类头
验证集准确率达到85%后，再逐步解冻更多层进行微调
工业场景中更关注ng_gray的召回率而非整体准确率

一个实用的验证指标计算方式：

python复制def ng_recall(y_true, y_pred):
    ng_mask = tf.equal(y_true, 0)  # ng_gray类别索引为0
    ng_true = tf.boolean_mask(y_true, ng_mask)
    ng_pred = tf.boolean_mask(y_pred, ng_mask)
    return tf.keras.metrics.recall(ng_true, ng_pred)

对于unk_gray类别的处理，建议建立反馈机制：将这些样本收集后由人工标注，定期更新模型。实际项目中，我们通过这种方式在3个月内将unk_gray比例从34.7%降低到12.5%。