高斯过程(Gaussian Process, GP)作为函数空间的概率分布,其核心在于任意有限点集的联合分布都是高斯分布。这种特性使其成为非参数贝叶斯建模的理想工具。从技术实现角度看,GP由均值函数m(x)和协方差函数kθ(x,x')完全定义,其中协方差函数(又称核函数)决定了函数的平滑性和相似性度量。
在实际应用中,我们通常假设均值函数为零(即m(x)=0),这并不是因为真实问题中均值确实为零,而是为了简化计算。这种假设下,所有建模能力都交由核函数承担。观察到的输出y与真实函数值f(x)的关系可表示为y = f(x) + ε,其中ε~N(0,σ²_ε)是观测噪声。当获得观测数据D_t = {X,y}后,新查询点x*的后验分布仍然是高斯分布,其均值和方差由以下关键公式决定:
µ_t(x) = k_t,θ(x)^T(K_t;θ + σ²_εI)^(-1)y
σ²_t(x) = kθ(x,x) - k_t,θ(x)^T(K_t;θ + σ²_εI)^(-1)k_t,θ(x)
实际操作提示:计算矩阵逆(K + σ²I)^(-1)时,建议使用Cholesky分解而非直接求逆,数值稳定性更高。当条件数过大时,可添加微小单位矩阵(如1e-6*I)确保正定性。
核函数的选择直接影响GP的建模能力。常见核函数及其适用场景包括:
核函数可通过加法或乘法组合,例如SE×PER能建模具有周期性调制幅度的过程,而LIN+RQ(有理二次核)可同时捕获全局趋势和局部变化。下表对比了典型核函数的特性:
| 核类型 | 数学形式 | 适用场景 | 超参数 |
|---|---|---|---|
| SE | σ²exp(-r²/2l²) | 超平滑函数 | l, σ² |
| Matern-5/2 | σ²(1+√5r/l+5r²/3l²)exp(-√5r/l) | 中等平滑 | l, σ² |
| PER | σ²exp(-2sin²(πr/p)/l²) | 周期性数据 | l, p, σ² |
| LIN | σ²xx' + σ²_c | 线性关系 | σ², σ²_c |
贝叶斯优化通过GP构建目标函数的代理模型,再通过采集函数指导下一个评估点的选择。期望改进(Expected Improvement, EI)是最常用的采集函数,其数学表达式为:
EI(x) = E[max(0, f(x) - f⁺)] = σ(x)[uΦ(u) + φ(u)]
其中u = (µ(x) - f⁺)/σ(x),f⁺是当前最优观测值,Φ和φ分别是标准正态分布的CDF和PDF。EI自动平衡探索(高σ(x)区域)和开发(高µ(x)区域),无需手动调节权重。
避坑指南:当σ(x)→0时,EI计算可能出现数值不稳定。实践中应对σ(x)设置下限(如1e-6),同时使用对数空间计算避免溢出。
核函数及其超参数的选择是GP建模的关键挑战。边际似然(Marginal Likelihood)是常用的选择标准:
log p(y|X,k) ≈ log p(y|X,θ̂,k) + log p(θ̂) - 1/2 log detΣ^(-1) + dθ/2 log(2π)
其中θ̂是超参数的MAP估计,Σ是Hessian矩阵。贝叶斯信息准则(BIC)作为其近似,通过惩罚项防止过拟合:
BIC = -2log p(y|X,θ̂,k) + dθ log n
实际应用中,我们常采用以下策略:
传统核选择依赖人工经验,而进化算法提供了自动化解决方案。CAKE(Compositional Acquisition of Kernel Structures with Evolution)框架包含三个关键参数:
进化过程通过交叉和变异操作生成新核:
实战技巧:设置早停机制——当最佳适应度连续G代(如G=5)未提升时终止进化,节省计算资源。
GP的O(n³)计算复杂度限制了其可扩展性。常用加速技术包括:
下表对比了不同方法的计算成本:
| 方法 | 时间复杂度 | 空间复杂度 | 适用场景 |
|---|---|---|---|
| 精确GP | O(n³) | O(n²) | n < 1,000 |
| FITC | O(nm²) | O(nm) | 1,000 < n < 10,000 |
| KISS-GP | O(n) | O(n) | 规则网格数据 |
在HPOBench基准测试中,针对不同模型的关键超参数:
实验数据显示,进化核优化相比固定核(如SE)平均提升22.2%的样本效率,在有限评估预算下优势更明显。
以月球着陆器为例,奖励函数包含:
通过GP-BO优化控制参数,可在20-30次试验内找到稳定控制策略,相比网格搜索效率提升5-8倍。
多目标优化指标包括:
复合核(M5×SE)+(LIN×RQ)能同时建模器件参数的全局趋势和局部波动,在150次仿真内找到Pareto前沿。
预测方差过大:
优化陷入局部最优:
计算内存不足:
在机器人控制任务中,我们通过将SE核与周期核结合,成功捕捉了系统动力学中的谐振特性;而在化学分子属性预测中,Matérn-3/2核与线性核的组合对描述分子结构的层次特征特别有效。