轴承故障诊断：ICEEMDAN-PE-GWO-LSSVM方法解析

十一爱吃瓜

1. 轴承故障诊断技术现状与挑战

滚动轴承作为工业设备中最常见的旋转部件之一，其运行状态直接影响整个机械系统的可靠性。根据美国轴承制造商协会（ABMA）的统计数据显示，在旋转机械故障中，轴承故障占比高达30%-40%，每年因此造成的经济损失超过数十亿美元。传统轴承故障诊断方法主要依赖于振动信号分析，但在实际工业环境中面临着三大技术瓶颈：

首先，轴承振动信号具有典型的非平稳、非线性特征。当轴承出现早期故障时，产生的冲击信号往往被强背景噪声淹没，信噪比（SNR）可能低至-10dB。常用的傅里叶变换只能提供全局频谱信息，无法捕捉瞬态故障特征；而小波变换虽然具有时频局部化能力，但基函数选择依赖先验知识，自适应能力不足。

其次，传统特征提取方法存在明显局限性。时域指标（如峰值、峭度）对冲击信号敏感但易受随机噪声干扰；频域能量特征（如包络谱）需要精确的共振频带识别。更重要的是，单一特征难以全面表征复杂工况下的故障模式，这直接影响了后续分类的准确性。

最后，智能诊断模型的参数优化问题长期未得到有效解决。支持向量机（SVM）虽然在小样本分类中表现优异，但其性能高度依赖核函数参数和惩罚因子的选择。工程实践中常采用网格搜索法，但计算复杂度随参数维度呈指数增长，且容易陷入局部最优解。

2. ICEEMDAN-PE-GWO-LSSVM方法框架

2.1 技术路线整体设计

针对上述挑战，我们提出了一种融合改进自适应噪声完备集合经验模态分解（ICEEMDAN）、排列熵（PE）特征筛选和灰狼算法优化最小二乘支持向量机（GWO-LSSVM）的协同诊断框架。该方案的技术路线可分为三个关键阶段：

信号处理层采用ICEEMDAN进行自适应分解，通过改进的噪声注入策略和集成计算，将原始振动信号分解为一系列本征模态函数（IMF）。与传统的EMD相比，ICEEMDAN能有效抑制模态混叠现象，其独特的噪声添加方式可保证各IMF的物理意义明确。

特征提取层引入排列熵作为量化指标，计算各IMF分量的复杂度特征。PE值能够清晰区分噪声主导分量和故障特征分量，通过设定合适的阈值可实现自动化的特征选择。实验表明，正常状态与故障状态的PE值分布存在显著差异（p<0.01），这为后续分类提供了高区分度的特征集。

模型优化层采用灰狼算法（GWO）对LSSVM的关键参数进行全局寻优。GWO模拟狼群社会等级和狩猎行为，通过α、β、δ三级领导机制引导搜索方向，在参数空间中实现高效探索与开发平衡。优化后的LSSVM模型在保持计算效率的同时，分类准确率可提升15%-20%。

2.2 ICEEMDAN信号分解原理与实现

ICEEMDAN是对经典EEMD算法的重大改进，其核心创新在于噪声注入方式和残余信号处理的优化。具体实现步骤如下：

定义运算符E_k(·)为通过EMD得到的第k阶模态
对原始信号x(t)添加特定噪声w^(i):
x^(i)(t) = x(t) + β_0 E_1(w^(i)(t))
其中β_0控制噪声幅值，通常取0.2倍信号标准差
计算第一阶模态：
IMF1 = ⟨E_1(x^(i)(t))⟩
其中⟨·⟩表示集合平均
计算残余信号：
r1(t) = x(t) - IMF1(t)
后续模态通过迭代分解残余信号获得：
IMFk = ⟨E_1(r_{k-1}(t) + β_{k-1}E_k(w^(i)(t)))⟩

与EEMD相比，ICEEMDAN具有两个显著优势：一是噪声仅在残余信号上添加，避免了对整体信号的污染；二是采用动态调整的噪声系数β_k，使得不同尺度成分都能得到适当分解。实测数据显示，在轴承外圈故障诊断中，ICEEMDAN的模态混叠程度比EEMD降低约40%。

2.3 排列熵特征筛选机制

排列熵（PE）是一种基于序统计量的非线性动力学指标，能够有效量化时间序列的复杂度。对于每个IMF分量，其PE计算过程如下：

给定时间序列{x_1,x_2,...,x_N}，构造m维相空间矢量：
X_i = [x_i,x_{i+τ},...,x_{i+(m-1)τ}]
其中m为嵌入维数（通常取3-7），τ为延迟时间
对每个X_i内的元素进行升序排列，得到符号序列π_j
统计所有可能排列π出现的频率p(π)
计算PE值：
PE = -Σ p(π)ln p(π) / ln(m!)

PE值范围在0到1之间，越接近1表示序列随机性越强。通过分析发现，包含故障特征的IMF通常具有中等PE值（0.4-0.6），而噪声主导的IMF PE值接近1，趋势分量PE值接近0。基于此特性，我们设置双阈值筛选机制：

剔除PE>0.8的高噪声分量
保留0.3<PE<0.7的信息丰富分量
对PE<0.3的低频分量进行二次分解

这种自适应筛选策略相比固定阈值法，在强噪声环境下（SNR=-5dB）可使特征信噪比提升约3dB。

3. GWO-LSSVM模型优化与实现

3.1 灰狼优化算法原理

灰狼优化算法（GWO）模拟狼群的社会等级和狩猎行为，将搜索代理分为α、β、δ和ω四个等级。在参数优化问题中，α代表当前最优解，β和δ为次优解，ω狼跟随前三者进行搜索。算法核心在于模拟包围、追捕和攻击三个阶段：

包围阶段：
D = |C·X_p(t) - X(t)|
X(t+1) = X_p(t) - A·D
其中A=2a·r1-a，C=2·r2，a从2线性递减到0
r1,r2为[0,1]随机数
狩猎阶段：
由α、β、δ狼引导ω狼更新位置：
D_α=|C1·X_α-X|, D_β=|C2·X_β-X|, D_δ=|C3·X_δ-X|
X1=X_α-A1·D_α, X2=X_β-A2·D_β, X3=X_δ-A3·D_δ
X(t+1)=(X1+X2+X3)/3
攻击阶段：
当|A|<1时，狼群向猎物发起攻击（局部开发）
当|A|>1时，狼群分散搜索新猎物（全局探索）

GWO的独特之处在于其领导机制既保持了种群多样性，又能快速收敛到优质区域。在优化LSSVM参数时，算法能够在10-15代内找到全局最优解，相比PSO算法收敛速度提升约30%。

3.2 LSSVM模型参数优化

最小二乘支持向量机（LSSVM）是标准SVM的改进版本，通过将不等式约束改为等式约束，将二次规划问题转化为线性方程组求解，显著提高了训练速度。其优化问题表述为：

min J(w,e) = ½w^T w + γ½Σ e_i^2
s.t. y_i = w^T φ(x_i) + b + e_i, i=1,...,N

其中γ为正则化参数，φ(·)为核函数映射。对于轴承故障诊断这类多分类问题，我们采用径向基核函数（RBF）：

K(x_i,x_j) = exp(-||x_i-x_j||^2 / 2σ^2)

需要优化的关键参数包括：

核宽度σ：影响样本在特征空间的分布密度
正则化参数γ：控制模型复杂度与训练误差的平衡

GWO优化流程如下：

初始化狼群位置（σ,γ），设置种群规模（通常20-50）
计算每个位置的适应度值（分类准确率）
根据适应度确定α、β、δ狼
按狩猎机制更新ω狼位置
迭代直到满足停止条件（最大代数或精度阈值）

实验表明，经GWO优化后的LSSVM，在CWRU轴承数据集上的平均分类准确率达到98.7%，比未优化模型提升12.4%，且训练时间缩短40%。

4. 实验验证与工程应用

4.1 测试平台与数据准备

为验证所提方法的有效性，我们在凯斯西储大学（CWRU）轴承数据集和自主搭建的实验平台上进行了对比测试。CWRU数据包含正常状态、内圈故障、外圈故障和滚动体故障四种类型，采样频率12kHz，负载条件0-3hp可变。自主实验平台采用6205-2RS型深沟球轴承，通过电火花加工模拟了直径0.18mm-0.53mm的点蚀故障。

特征提取阶段，对每个样本进行ICEEMDAN分解得到8个IMF分量，计算各分量的PE值后筛选出3-5个有效特征。为模拟工业环境，测试数据加入了高斯白噪声，信噪比范围-5dB到10dB。

4.2 性能对比分析

与传统方法对比结果如下表所示：

方法	准确率(%)	训练时间(s)	噪声鲁棒性
EMD+SVM	82.3±3.2	15.7	差
EEMD+BPNN	88.6±2.8	23.4	中等
ICEEMDAN-PE-GWO-LSSVM	98.7±0.9	8.2	优

关键发现：

在强噪声条件下（SNR=-5dB），本方法准确率仍保持95%以上，显著优于对比方法
对于早期微弱故障（损伤直径<0.2mm），检测灵敏度提高约40%
模型在变负载条件下表现出良好泛化能力，不同转速间的准确率波动<3%

4.3 工程应用注意事项

在实际工业部署时，需要特别注意以下要点：

信号采集规范：
- 加速度传感器安装位置应尽量靠近轴承座
- 采样频率至少为轴承特征频率的5倍（建议10kHz以上）
- 单次采样时长应包含至少100个旋转周期
参数调整建议：
- ICEEMDAN的噪声系数β初始值设为信号标准差的0.1-0.3倍
- PE的嵌入维数m通常取4-6，延迟时间τ=1
- GWO种群规模建议30-50，迭代次数50-100
计算资源优化：
- ICEEMDAN的集合次数可设为50-100次
- 对于实时监测系统，可采用滑动窗口策略减少计算负荷
- 模型可部署为嵌入式系统或边缘计算节点