这个数据集是我在风电行业工作八年期间逐步积累形成的实战资源包,专门针对风电机组关键部件的故障诊断需求设计。与传统单一维度的监测数据不同,我们创新性地融合了SCADA系统的时间序列数据与机组三维空间振动特征,形成了国内首个公开的时空融合风电故障数据集。
风电行业有个痛点:单纯依靠SCADA系统的温度、转速等时序参数,只能识别约60%的典型故障;而仅分析振动频谱又难以关联机组运行状态。我们通过在某风电场2MW机组上部署的32通道振动监测系统(采样率25.6kHz)与SCADA系统(1Hz采样)的精确时间同步,实现了两种数据的毫秒级对齐。这个数据集目前包含:
重要提示:数据集特别标注了故障发生前72小时的完整数据序列,这对早期故障预警模型开发至关重要。我们实测发现,轴承故障在完全失效前36小时就能在振动高频段(8-12kHz)出现特征谐波。
现场采用GPS授时模块为所有采集设备提供统一时钟源,通过PTP协议实现μs级时间同步。这里有个工程细节:SCADA系统的Modbus TCP协议本身存在50-100ms的通信延迟,我们在数据预处理阶段用滑动窗口动态补偿算法消除了这个误差。
具体同步流程:
数据集提供原始振动波形和预处理后的特征矩阵两种格式。对于时频分析,我们推荐按以下流程处理:
python复制# 小波包分解示例(提取高频故障特征)
import pywt
wp = pywt.WaveletPacket(data=np.load('vibration.npy'),
wavelet='db8',
mode='symmetric')
# 重构8-12kHz频段节点
node_path = 'dddd' # 根据实际采样率调整
hf_component = wp[node_path].reconstruct()
特征工程中特别注意:
我们基于该数据集开发的双流神经网络架构,在测试集上达到92.3%的故障分类准确率(传统单模态模型约75%)。核心结构包括:
mermaid复制graph TD
A[SCADA数据] --> B[LSTM编码]
C[振动信号] --> D[3D CNN编码]
B --> E[注意力融合]
D --> E
E --> F[故障分类]
避坑指南:振动信号建议先做测点间PCA降维,否则空间流参数量会爆炸。我们实测保留前3个主成分即可保持95%的原始信息。
以发电机轴承早期磨损为例,数据集中包含12个完整发展周期的数据。关键预警特征包括:
数据采样建议:
常见误判场景:
硬件选型参考:
| 设备类型 | 推荐型号 | 关键参数 |
|---|---|---|
| 振动传感器 | PCB 352C33 | 频响1Hz-15kHz |
| 采集设备 | NI cDAQ-9188 | 同步精度<1μs |
| 边缘计算 | ADLINK MXE-2000 | 支持实时FFT |
这个数据集目前已在某风电集团30个场站部署应用,平均故障预警时间提前了58小时。对于科研用途,我们提供降采样版本(振动数据降频到5kHz),完整工业级数据集需要签订保密协议获取。