1. 数据集背景与行业需求
风电作为清洁能源的重要组成部分,其设备可靠性直接影响发电效率和运维成本。传统故障诊断方法主要依赖单一时间序列数据,难以捕捉设备状态的空间关联性和环境耦合效应。这个数据集创新性地融合了SCADA时序数据、机组三维振动图谱和局部温度场分布,首次实现了多物理量时空特征的联合建模。
在北方某风电场实际应用中,仅使用SCADA数据的传统模型误报率高达23%,而引入本数据集后误报率降至7.8%。数据集包含2.5MW机组在6种典型故障模式(包括齿轮箱点蚀、主轴不对中、发电机轴承磨损等)下的完整运行记录,时间分辨率达到100ms,空间采样点超过200个/机组。
2. 数据采集与特征工程
2.1 多源传感网络部署
数据采集采用分层式传感架构:
- 时序层:标准SCADA系统(采样频率1Hz)
- 振动层:8通道无线加速度计阵列(采样频率5kHz)
- 热力层:红外热像仪(分辨率640×512,帧率30Hz)
关键安装位置选择:
- 齿轮箱输入/输出轴各布置2个振动传感器
- 发电机前后端盖采用十字交叉测温布局
- 主轴承座设置环形测温阵列
特别注意:振动传感器需采用磁吸底座配合螺纹加固,避免高频振动导致信号漂移。实测表明未加固的传感器在半年内会产生15%的幅值误差。
2.2 时空特征提取方法
时间维度处理:
- 采用改进的STFT时频分析(窗函数选用Nuttall窗)
- 构建基于Weibull分布的运行工况划分模型
- 典型特征包括:
- 齿轮啮合频率边带能量比
- 轴承特征频率的谐波衰减系数
- 温度梯度变化率
空间维度处理:
- 振动数据采用球面波分解算法
- 温度场使用Delaunay三角剖分插值
- 关键空间特征:
- 振动能量传播方向角
- 热斑迁移轨迹曲率
- 三维模态振型相关系数
3. 数据集构建规范
3.1 数据标注流程
采用三级验证机制:
- SCADA报警触发初级标注
- 振动频谱专家复核(符合ISO 10816-3标准)
- 拆解检验最终确认
标注内容包含:
- 故障类型(采用VDI 3834分类标准)
- 发展阶段(早期/中期/晚期)
- 位置坐标(机组局部坐标系)
3.2 数据增强策略
针对样本不平衡问题:
- 时域采用WGAN-GAN生成对抗样本
- 空域使用弹性形变数据增强
- 环境干扰模拟:
- 塔筒摆动补偿
- 风速扰动注入
- 电网电压波动模拟
4. 典型应用案例
4.1 卷积-图神经网络融合模型
构建双通道处理架构:
- 通道1:处理SCADA+振动时序(1D-CNN)
- 通道2:处理温度场+振动空间分布(GAT)
在齿轮箱点蚀检测中达到:
- 早期故障识别率:92.3%(传统方法68.7%)
- 误报率:5.2%(传统方法19.8%)
4.2 数字孪生系统集成
将数据集接入ROS框架实现:
- 故障演化过程三维可视化
- 剩余寿命预测(误差<8%)
- 维修策略优化(降低停机时间37%)
5. 使用注意事项
-
数据预处理必做步骤:
- 振动信号必须进行转速归一化
- 温度数据需做环境温度补偿
- SCADA参数需进行工况对齐
-
常见错误处理:
- 遇到振动信号饱和:检查传感器量程设置
- 温度场出现断层:重新校准红外热像仪
- 时序不同步:使用PTP协议重新对时
-
计算资源建议:
- 时空联合分析需要至少24GB显存
- 推荐使用NVIDIA A100进行模型训练
- 内存建议配置128GB以上
这个数据集的价值在于突破了传统单维度分析的局限,我们团队在后续研究中发现,结合叶片声发射数据可以进一步提升变桨系统故障的检测灵敏度。实际部署时建议建立特征重要性评估机制,动态优化采样策略。