新能源竞赛(2) 数据处理
以下的一些关于数据的总结和思考来自 dw
新能源交流群3的陈昱佬
1,1-5的风电项目,影响最大的是风速和气压,其次是风向。6-10光伏项目影响最大的是倾斜面辐照poai和温度t2m。
2,气象数据的网格,一般会远大于项目面积。在目前没有地理数据的情况下,取一个居中点的数据即可。
3,这个项目的参数量很少,且大多可以从原理上判断与发电量的关联性。因此可以直接用拟合(机器学习的价值有限)。提高准确率,可能更依赖于数据清洗和预处理。
可以数据分析后,找一个关联度 最高的气象站。
不同气象数据对 项目的代表性,是有差异的。
满分是多少分
看公式,满分是100%
实际应用中,电力市场考核风光项目,基于前一天的气象预测数据 预测的负荷准确率要90%。低了会有扣罚。
气象站的观测数据是按小时给出的嘛nwp
都是按小时给,但是预测是要按15分钟
这个确实。一般用更高精度数据,预测低精度数据。
赛题可能是有意增加难度
光伏可以用相邻小时的辐照,来大致推测15min间隔的变化趋势。
风电 可以用风速,但效果不确定。
好思路[ThumbsUp],我一开始的想法是先按照小时预测,再进行插值
也可以先插值再做
从光伏数据看,气象数据是整点数据,不是平均数据。
整点气象数据和整点的功率数据,应该会有比较好的对应关系。用这个数据,可能质量高一些。
使用地理位置点中间的一些做均值,甚至不做均值,就用中间的一个点
分析标签的分布情况
改一下损失loss
打印输出进行观察
可以做的一些尝试:
[√] 使用地理位置点中间的一些做均值,甚至不做均值,就用中间的一个点
分析标签的分布情况
改一下损失loss,把输出的计算公式换成官方的这个
打印输出进行观察
风电中有nan
本博客所有文章除特别声明外,均采用 CC BY-NC-SA 4.0 许可协议。转载请注明来源 Tipriest's Blog!