以下的一些关于数据的总结和思考来自 dw新能源交流群3的陈昱佬


1,1-5的风电项目,影响最大的是风速和气压,其次是风向。6-10光伏项目影响最大的是倾斜面辐照poai和温度t2m。
2,气象数据的网格,一般会远大于项目面积。在目前没有地理数据的情况下,取一个居中点的数据即可。
3,这个项目的参数量很少,且大多可以从原理上判断与发电量的关联性。因此可以直接用拟合(机器学习的价值有限)。提高准确率,可能更依赖于数据清洗和预处理。


可以数据分析后,找一个关联度 最高的气象站。
不同气象数据对 项目的代表性,是有差异的。


满分是多少分
看公式,满分是100%

实际应用中,电力市场考核风光项目,基于前一天的气象预测数据 预测的负荷准确率要90%。低了会有扣罚。


气象站的观测数据是按小时给出的嘛
nwp都是按小时给,但是预测是要按15分钟

这个确实。一般用更高精度数据,预测低精度数据。
赛题可能是有意增加难度

光伏可以用相邻小时的辐照,来大致推测15min间隔的变化趋势。
风电 可以用风速,但效果不确定。
好思路[ThumbsUp],我一开始的想法是先按照小时预测,再进行插值
也可以先插值再做
从光伏数据看,气象数据是整点数据,不是平均数据。
整点气象数据和整点的功率数据,应该会有比较好的对应关系。用这个数据,可能质量高一些。


4a3c7764461bc889dd3a42faeb5277a9.jpg
b51a98d7acab099ec7bd52323a4c3cba.jpg
使用地理位置点中间的一些做均值,甚至不做均值,就用中间的一个点

分析标签的分布情况

改一下损失loss

打印输出进行观察

可以做的一些尝试:
[√] 使用地理位置点中间的一些做均值,甚至不做均值,就用中间的一个点

分析标签的分布情况

改一下损失loss,把输出的计算公式换成官方的这个

打印输出进行观察

风电中有nan