风光混合发电出力预测数据集(15MW)

一、数据集构建背景与总体思路

本数据集基于“国网2021年可再生能源发电预测竞赛(State Grid Renewable Energy Generation Forecasting Competition)”的数据特征进行构建,并在此基础上完成容量缩放与结构重建,将原始数据统一调整至15MW等级。同时,为了弥补单一能源数据在建模中的局限性,进一步自主构建了风力与光伏协同发电的混合场站数据,使其更贴近当前新能源电站的发展趋势。

在构建过程中,并未采用简单的线性缩放或数据裁剪方式,而是从电力系统运行机理出发,结合时间序列建模与随机过程模拟,对环境变量与功率输出进行逐层生成。整体思路可以概括为:首先构建完整且连续的时间轴,在此基础上生成具有物理意义的环境变量,随后依据风机与光伏系统的运行机理推导出对应的发电功率,最后再引入电网侧约束对功率进行修正。通过这种“物理建模 + 随机扰动”的方式,使数据既具备真实系统的内在联系,又具有足够的复杂性以支撑机器学习模型的训练与验证。


二、时间序列与环境变量建模方法

数据集覆盖时间范围为2019年至2020年,时间分辨率为15分钟一个采样点,首先构建完整的时间序列索引,以保证数据在时间维度上的连续性与一致性。在此基础上,对温度、风速、风向等关键环境变量进行建模,并综合考虑季节变化、日内周期以及随机扰动等多重因素。

具体而言,温度通过年尺度的正弦函数刻画季节性变化,同时叠加日内周期变化以反映昼夜温差,并引入连续随机扰动来模拟天气波动,使温度序列既平滑又具备不确定性。风速的生成则更加复杂,其不仅包含季节因子与昼夜变化,还引入具有时间相关性的自回归(AR)随机过程,从而保证风速在时间上的连续性与惯性特征;此外,还额外叠加阵风与短时突变事件,使其在局部时间尺度上呈现出更强的波动性。风向方面,则采用缓慢漂移叠加随机扰动的方式生成,并通过偶发跳变来模拟天气系统变化对风场结构的影响,使整体风场特征更加贴近实际运行环境。


三、风电与光伏功率生成机制

在风电侧,首先依据典型风机功率曲线,将风速映射为理论输出功率,从而保证功率与风速之间满足基本物理关系。在此基础上,引入设备可利用率波动、小规模故障以及测量噪声等现实因素,对理想功率进行修正,使最终风电出力既具备物理一致性,又能够反映实际运行中的非理想状态,例如功率波动、突降以及测量误差等现象。

在光伏侧,首先根据地理纬度、日期与时间信息近似计算日出日落时间及白天辐照度变化曲线,从而构建基本的辐照分布形态。在此基础上,进一步叠加季节性辐照强弱变化以及按天变化的天气状态,同时引入日内连续云层扰动与云团遮挡事件,使辐照度序列在保持整体趋势的同时具备局部随机性。随后结合环境温度对光伏组件效率的影响(如温升导致效率下降),并考虑装机容量(统一为15MW)、系统损耗、可利用率波动以及逆变器侧噪声,最终生成更接近实际电站运行特性的光伏输出功率。


四、混合出力构建与电网约束机制

在分别得到风电与光伏出力后,将二者进行叠加形成场站的毛出力(Hybrid Gross)。然而,在真实电力系统中,电站输出往往受到并网条件的限制,因此在本数据集中进一步引入并网点送出上限,以模拟限发与弃电现象。当风光出力超过电网可接纳能力时,多余部分将被削减,从而使最终输出功率(Power)不再是简单的线性叠加结果,而是体现了电网约束条件下的实际可上网功率。

通过上述过程,数据集不仅保留了风速、辐照度、温度与功率之间的物理关联关系,还通过引入随机扰动、设备故障、云遮挡以及限电机制,显著增强了数据的真实性与复杂性。这使得该数据集在风光功率预测、多能源协同建模以及时间序列分析等任务中具有较高的研究价值与应用意义。


五、数据下载

点击下载数据集


六、说明

本数据集为基于公开竞赛数据特征进行重构与模拟生成,仅用于学术研究与学习交流,不代表真实电站运行数据。