光伏发电作为清洁能源的重要组成部分,其功率预测一直是电力系统运行中的关键课题。传统点预测方法只能给出单一数值结果,无法反映光伏发电固有的不确定性。我在参与多个光伏电站预测系统开发过程中,深刻体会到概率预测对电网调度决策的重要性——它不仅能提供预测值的可能范围,还能给出各个范围出现的概率,这对应对光伏发电的间歇性至关重要。
现有概率预测方法主要面临两个技术瓶颈:首先是分位数交叉问题,即低分位数的预测值可能高于高分位数,这与概率定义相矛盾;其次是时空相关性建模不足,多数方法仅考虑单一电站的时间序列特征,忽略了邻近电站间的空间关联。我们团队在2022年开发的这个基于MBLS和Copula的混合模型,正是针对这些痛点提出的创新解决方案。
关键创新点:MBLS的单调性约束从根本上杜绝了分位数交叉,而Copula理论则优雅地刻画了多电站间的空间依赖关系。这种组合在澳大利亚的实际应用中,将预测区间覆盖率提高了15%以上。
MBLS的核心在于其特殊的网络结构和损失函数设计。与普通BLS(Broad Learning System)相比,MBLS在特征节点和增强节点之间增加了单调性约束层。具体实现时,我们采用带ReLU激活的全连接网络,但对权重矩阵施加非负约束:
matlab复制% MATLAB实现中的关键代码片段
W = rand(nFea,nWin); % 初始化权重
W = max(W,0); % 施加非负约束
H = max(X*W,0); % 带ReLU的变换
这种设计保证了网络的输出随输入单调递增,从数学上确保了两个不同分位数τ₁ < τ₂时,总有Q̂(τ₁) ≤ Q̂(τ₂)。我们在美国加州光伏数据集上的测试表明,这种方法比传统QRNN减少约90%的分位数交叉现象。
MBLS采用改进的分位数损失函数,对于第τ分位数预测,损失函数定义为:
Lτ(y, ŷ) = max(τ(y - ŷ), (τ - 1)(y - ŷ))
在实现时,我们采用随机梯度下降进行优化,学习率设置为0.001,批量大小128。值得注意的是,MBLS需要为每个分位数单独训练一个模型,这虽然增加了计算量,但换来了严格的单调性保证。
MBLS有三个关键超参数需要优化:
我们采用网格搜索结合交叉验证的方法确定最优组合。以澳大利亚数据集为例,最终确定的参数为numFea=4,numWin=20,numEnhan=114。这个过程虽然耗时(约6小时),但使RMSE降低了约23%。
Copula函数的核心价值在于能将边缘分布与依赖结构分离建模。在光伏预测场景中,我们测试了三种常见Copula:
| Copula类型 | 优点 | 缺点 | 适用场景 |
|---|---|---|---|
| Gaussian | 计算简单 | 无法捕捉尾部相关 | 线性相关主导 |
| t-Copula | 能建模尾部相关 | 参数估计复杂 | 极端值重要 |
| Clayton | 擅长下尾相关 | 不对称性 | 低功率场景相关性强 |
实际应用中,我们通过AIC准则选择最优Copula。例如在美国德州电站群中,t-Copula(自由度ν=3)表现最佳,因其能更好捕捉多云天气下多个电站同时出现功率骤降的现象。
为处理光伏数据的非平稳性,我们先用SOM对历史数据进行聚类。具体步骤包括:
这个过程将数据划分为6个典型场景(晴天、多云、雨天等),每个场景单独建立Copula模型。实践表明,这种分治策略使预测区间覆盖率从82%提升到89%。
原始数据需经过严格清洗:
matlab复制% 缺失值处理
data = fillmissing(rawData, 'movmedian', 24*7); % 周滑动中值填充
% 异常值检测
[cleanData, TF] = rmoutliers(data, 'gesd'); % 使用Grubbs检验
% 归一化
[normalizedData, PS] = mapminmax(cleanData'); % 缩放到[-1,1]
特别注意气象数据的质量控制,错误的气象预报会导致预测系统性偏差。我们建立了气象数据可信度指标,当可信度低于阈值时自动切换为历史相似日数据。
MBLS的预测流程如下:
关键实现技巧:
整合MBLS和Copula的步骤:
matlab复制% Copula场景生成示例
U = copularnd('t', R, nu, nScenarios); % 生成均匀变量
scenarios = zeros(nSites, nSteps, nScenarios);
for i = 1:nSites
scenarios(i,:,:) = quantile(marginals{i}, U(:,i));
end
分位数交叉现象再现
预测区间覆盖不足
计算时间过长
数据层面
模型层面
工程实现
在实际部署中,我们发现早晨和傍晚的预测误差通常较大。通过针对性增加这两个时段的训练样本权重,使日平均误差降低约1.5个百分点。
我们采用多维度评估指标:
| 指标类型 | 具体指标 | 计算公式 | 理想值 |
|---|---|---|---|
| 准确性 | RMSE | √(1/nΣ(y-ŷ)²) | 越小越好 |
| 可靠性 | PICP | 实际值在区间内的比例 | 接近名义置信度 |
| 锐度 | PINAW | 区间宽度归一化值 | 在保证PICP时越小越好 |
| 综合 | CRPS | ∫(F(x) - 1{y≤x})²dx | 越小越好 |
在澳大利亚数据集上的对比结果:
| 方法 | RMSE(MW) | PICP@90% | CRPS |
|---|---|---|---|
| QR-ELM | 3.21 | 83.2% | 1.78 |
| QRNN | 2.98 | 85.7% | 1.62 |
| 本文方法 | 2.63 | 91.5% | 1.34 |
结果显示我们的方法在各项指标上均有显著优势,特别是在保持预测区间合理宽度的同时,实现了更高的覆盖率。
在某省级电网的部署数据显示:
这些改进主要源于概率预测提供的更丰富信息,使调度人员能做出更精准的决策。特别是在多云天气条件下,系统能提前预警功率波动风险。