markdown复制## 1. 高斯过程与贝叶斯优化基础解析
### 1.1 高斯过程的数学本质
高斯过程(GP)本质上是对函数空间的概率分布建模。其核心由均值函数m(x)和协方差函数k(x,x')构成,任何有限点集的函数值服从联合高斯分布。实践中常设m(x)=0,此时模型完全由核函数决定。例如径向基核(RBF)的数学形式为:
```math
k_{SE}(x,x') = \sigma^2 \exp\left(-\frac{(x-x')^2}{2l^2}\right)
其中长度尺度l控制函数波动频率,方差σ²决定输出幅度。这种结构使得GP能自动适应不同平滑度的函数模式。
关键理解:核函数本质是定义两个输入点间的相似性度量,直接影响函数插值行为。长度尺度较小时,GP会对局部变化更敏感。
贝叶斯优化的迭代过程包含三个核心环节:
以期望改进(EI)为例,其闭式解为:
python复制def expected_improvement(X, gp_model, best_y):
mu, sigma = gp_model.predict(X, return_std=True)
delta = mu - best_y
z = delta / sigma
return delta * norm.cdf(z) + sigma * norm.pdf(z)
| 核类型 | 数学形式 | 适用场景 | 超参数先验设置 |
|---|---|---|---|
| 周期核(PER) | exp(-2sin²(π | x-x' | /p)/l²) |
| 有理二次核(RQ) | (1+(x-x')²/(2αl²))^(-α) | 多尺度变化 | Gamma(2,2) for α,l |
| Matérn-5/2 | (1+√5r+5r²/3)exp(-√5r) | 中等平滑过程 | Gamma(2,2) for l |
通过加法/乘法组合基础核可形成更丰富的函数空间:
SE + PER捕获趋势+周期)LIN × RQ实现可变平滑度)实际案例:在光子芯片设计中,采用(SE×PER)+(LIN×RQ)核能同时优化激光波长(周期性敏感)和输出功率(线性相关)。
边缘对数似然的Laplace近似:
math复制\log p(y|X,k) \approx \log p(y|X,\hatθ,k) - \frac{1}{2}\log|\Sigma^{-1}| + C
优化时需注意:
| 现象 | 可能原因 | 解决方案 |
|---|---|---|
| EI值持续为0 | 长度尺度过大 | 重置为数据范围1/10 |
| 方差爆炸 | 噪声低估 | 设置σ²ₑ下限1e-6 |
| 优化轨迹震荡 | 采集函数过探索 | 改用LCB(κ=2.0) |
最新研究显示,将神经网络的表示能力与GP的概率校准结合(如Deep Kernel Learning)可提升高维优化效果。但在样本量<50时,传统GP仍具优势。一个值得关注的趋势是使用BO自动设计核函数结构,如通过语法树演化生成定制化核。
个人实践建议:对于黑箱函数评估成本极高的场景(如CFD仿真),建议先进行20次Latin超立方采样初始化,再启动BO流程。某风电叶片优化项目中,该方法使收敛速度提升3倍。
code复制