Elsevier

 应用能源


第 358 卷,2024 年 3 月 15 日,122671
Applied Energy


考虑动态时延估计的 Elman 神经网络用于海上风电的短期预测

EI检索SCI升级版 工程技术1区SCI基础版 工程技术1区IF 11.2SWJTU A++SWUFE A
http://ifbic81f8000da3924570s5vvufocn9qwp6ovp.fiac.kust.cwkeji.cn/10.1016/j.apenergy.2024.122671  获取权利和内容

 亮点


  • 提出并验证了一种描述变量间延迟关系的动态估算算法。


  • 为匹配不同平均周期的动态滑动窗口开发了一种统一方法。


  • 提出了一种基于动态时延的海上风电短期预测方法。


  • 所提出的策略具有更高的预测精度和可靠性。

 摘要


准确预测海上风力涡轮机的输出功率是提高电能质量、确保电网稳定运行的关键途径。现有研究侧重于利用历史数据或设计有效模型,而忽略了各监测变量与风电输出之间是否存在时延效应这一根本问题。因此,本文提出了一种考虑动态延迟效应的短期海上风电功率预测方法,以直观地获取功率预测信息。首先,基于非线性耦合关系,引入匹配不同平均周期的动态滑动窗口。然后,基于耦合格兰杰因果分析计算动态延迟时间,并定义变量之间的多重延迟关系。最后,利用 Elman 网络实现短期海上风电预测。通过海上风机连续 10 天的实际运行数据验证了所提方法的可行性和兼容性。结果表明,动态滑动窗口技术可以准确提取过程监测变量之间的动态时延关系。与其他方法相比,所提出的监测策略在所有主流指标上都具有最佳精度。10 天风力功率预测结果的平均 MAE 达到 0.0025,平均运行时间为 4.0869 s。拟议方法具有良好的稳定性,在海上风力涡轮机输出功率精确预测领域具有应用潜力。

 关键词


风能预测动态时延耦合关系分析伊尔曼网络

 术语

    rxy

     相关系数

    cxy

     相互协方差

    σ

     均方误差

    N


    时间序列的长度

    p


    输出神经元的传递函数

    s

     乙状结肠功能

    f


    条件概率密度

    GC


    格兰杰因果关系的价值

    E


    样本空间的期望值

    h


    条件联合密度

    CGC


    格兰杰因果关系的耦合价值

    m

     滞后订单

    n

     滞后订单

    w1


    延迟层到中间层的连接权重

    w2


    输入层到中间层的连接权重

    w3


    中间层到输出层的连接权重

    ENN

     埃尔曼神经网络

    CCF


    交叉相关函数

    DTD

     动态时间延迟

    HHT

     希尔伯特-黄变换

    NWP


    数值天气预报

    ARMA


    自动回归移动平均线

    ARIMA


    自动回归综合移动平均线

    DTW

     动态时间扭曲

 1.导言


风电技术的日趋成熟带动了全球风电产业的蓬勃发展,在改善能源结构组成的同时,也起到了减少环境污染、缓解各国电力短缺压力的作用[1]。然而,风电典型的随机性和间歇性,以及明显的反频率、反峰值特性[2]。这导致该地区许多机组的功率波动迅速而无序,机组频繁的切机过程给电网带来持续影响,从而极大地影响了电能质量和电网的稳定运行。风电系统的不确定性已成为系统规划[3,4]、风电场运行[5,6]、安全稳定[7,8]、性能优化[9,10]和电力市场交易[11,12]的核心问题。因此,如何准确预测风电输出是电力系统应对不确定性影响的前提。


为了提高短期风电预测的准确性,许多学者做了大量相关研究。现有的预测方法大致可分为三类:基于物理模型[13]、统计模型[14]和人工智能模型[15]。物理方法主要是利用控制大气行为的物理规律来模拟风场的气流场,然后计算相应的风力发电机发电量,其中近地风速[16]在物理方法中起着至关重要的作用。Hu 等人[17]将修正后的 NWP 和空间相关性整合到高斯过程中,并设计了一个风速修正模型来修正初始数值天气预报中的误差。同样,Brester 等人[18] 利用 NWP 数据和气象观测数据作为建立电能预测模型的基础。然而,物理技术计算复杂,很难在较长的预报期内获得令人满意的预报精度。统计方法[19]通常以人工经验为基础,建立区域内风电监测变量之间的某种相关性,如 ARMA [20] 和 ARIMA [21]。这些方法利用历史数据发现解释变量与发电量之间的关系,并利用统计模型计算预测结果。Liu 等人[22]提出了一种基于风速特征的风速预测新方法,该方法将风速分解为非线性、线性和噪声部分,并根据不同部分的特征建立不同的预测模型。Zhang 等人[23]使用基于季节 ARIMA 的混合模型预测苏格兰海上风力涡轮机的功率。然而,统计方法并不适用于解决非线性数据的功率预测问题。


近十年来,人工智能技术在质量监测 [24,25]、故障诊断 [26,27]、结构安全评估 [28,29],包括风能预测 [30,31]等多个领域蓬勃发展。正如 Ahmad 等人[32]所指出的,现有的风电预测技术缺乏模型优化和数据处理能力。从长远来看,需要高质量的风电数据序列来生成可提供有力政策建议的模型结果。Dong 等人[33]提出了一种基于堆叠框架的集合学习模型,以提高风电预测的稳定性。Karijadi 等人[34] 使用混合深度学习方法预测风力发电[35]。为了减少误差、提高风电预测的稳定性,Yin 等人基于集合学习[36]、自适应神经模糊推理系统[37]、双延迟深度确定性策略梯度算法[38]和基于特征融合的深度学习[39]开展了大量工作,设计出了多种优化方案。


目前,许多工作都集中在如何充分利用历史数据或设计有效模型上,而忽略了一个根本问题,即每个监测变量与风能输出之间是否存在时间延迟效应[40]。传统预测模型的大部分输入是来自风电场的历史数据和原始气象因素,通常不考虑变量之间的时间延迟信息[41]。Lotfi 等人[42] 提出了一种组合控制方案来调节输出电压,帮助系统在总谐波失真最小的情况下提高输出电压控制范围。Yin 等人[43] 将深度确定性策略梯度应用于功率系数的自适应调节,以提高发电效率。这些方法通常关注单一变量的变化趋势。其缺点之一是会影响预测模型的有效性和监测变量间相关性表达的准确性,进而导致预测任务执行不准确,以至于失败。例如,Shen 等人[44] 提出了一种延迟相关系数来确定非平稳时间序列之间的延迟水平。Yang等[45]利用CCF方法分析报警相关性,提取报警数据之间的传输或延迟时间,有效提高了带延迟时间序列相关性分析的规则效率。


DTW 在测量时间序列变量变化相似性的同时,有效地处理了时间序列的坐标压缩和拉伸现象 [46,47]。DTW 已被应用于多个领域,如非侵入式负载瞬态识别 [48]、可再生能源预测 [49] 和光伏发电日前功率预测 [50]。然而,目前报道的大多数时间延迟估计方法只是通过传统的静态时间窗方法估计变量之间的延迟,忽略了时间序列本身的动态特性[51]。因此,这种方法很难满足相关的精度要求。在时间延迟计算中,主要是给出一个恒定的估计值作为后续变量间相关性分析的基础或条件,从而忽略了复杂机电系统中时间延迟本身的动态特性[52]。探索一种有效表征服务变量间动态时延效应的估算方法,并结合动态时延效应对短期风电进行更准确的预测,具有重要的研究意义。


耦合格兰杰因果分析方法是一种基于互信息的因果分析方法,具有很强的鲁棒性。与偏相关系数[53]和格兰杰因果分析[54]相比,它具有更好的抗噪声能力,并能捕捉非线性关系。另一方面,与二元格兰杰因果关系[55]或基于信息矩阵的方法[56]相比,其计算复杂度较低。因此,本文在分析服务监测数据和模型机理的基础上,提出了一种考虑动态时延效应的短期海上风电预测方法。首先,引入与不同平均周期相匹配的动态滑动窗口,并统一确定最终计算的动态窗口大小。然后,计算基于耦合格兰杰因果分析的动态延迟时间,定义变量之间的多重时间延迟关系。最后,基于 Elman 网络实现的短期海上风电预测克服了现有方法忽略时间延迟效应或基于线性方法量化延迟时间的局限性。所提出的策略可以更准确、更直观地捕捉功率预测信息。本文的创新和贡献总结如下。

  • 1.


    当前的工作分析了服务监测数据和建模机制,说明了忽略延迟效应或基于线性方法量化延迟时间的局限性。为优化观测空间,提出了一种匹配不同平均周期动态滑动窗口的统一方法。

  • 2.


    本文提出了一种新的动态延迟评估计算方法。具体来说,该方法收集了多类变量的多种时延关系,以研究变量之间的时空效应。此外,还利用 Elman 神经网络来描绘变量之间的时延关系,从而完成风力发电的预测。

  • 3.


    海上风力涡轮机的实际运行数据验证了所提方法的可行性和兼容性。结果表明,该方法能准确提取监测变量之间的动态时延关系,从而实现准确的输出功率预测。通过与其他方法的比较,验证了所提研究思路的有效性和竞争力。


本文其余部分的结构如下。第 2 节简要介绍了时间延迟、耦合格兰杰因果度量分析方法和埃尔曼网络。随后,第 3 节介绍了一种动态时间延迟效应估计方法。第 4 节通过使用服役中的海上风力涡轮机实例并比较现有方法,验证了所提方法的有效性。最后,第 5 节得出结论。

 2.序言


本节首先介绍了传统时间延迟法的原理和不足,并明确了有待改进的研究要点。接下来,介绍耦合格兰杰因果分析原理,探讨过程监控变量之间的非线性耦合关系。


2.1.传统的时延计算方法


两个实时平稳时间序列之间的相关系数计算如公式 (1) 所示。
(1)rxylag=Cxylagσxσy=i=1nlagxtxyt+lagyi=1nxtx2i=1nyty212
其中, σx σy 分别是 xt yt 的均方误差。 Cxylag rxylag 分别指时间延迟滞后下 xt yt 之间的相互协方差和相互关系数。


假设两个时间序列之间存在特定的时间延迟,计算不同时间延迟下的相关系数值。当滞后的绝对值达到最大值时,两个时间序列的相关系数也就达到了最大值[57]。必须指出的是,上述公式不再适用于具有非平稳特征的时间序列。如图 1 所示,大多数传统方法使用静态滑动窗口来计算信息传输过程中的延迟关系。滑动窗口的大小通常是根据人工经验确定并粗略描述为一个常数。此外,也有一些研究涉及静态窗口的选择标准[58]。

Fig. 1

  1. 下载 :下载高清图片 (100KB)

  2. 下载 :下载 : 下载全尺寸图片


图 1.传统的静态滑动窗口


2.2.耦合格兰杰因果分析


耦合格兰杰因果度量表示随机变量的多元联合分布,即每个变量的边际分布,其中 copula 函数描述了相关的相关性。这样,两个变量之间的非线性关系就表达出来了。假设 X=xt Y=yt 分别是两个监测变量的时间序列。它们之间的因果关系可以用数学公式表示为
(2)fyt+1ytnxtm=fyt+1ytn
其中,f 表示条件概率密度,m 和 n 表示滞后阶数。根据格兰杰因果关系的原始概念,公式(2)的左侧表示时间序列 yt xt 的历史信息对预测 yt 当前值的影响。同样,等式右侧表示时间序列 yt 的过去值对 yt 当前预测值的影响。衡量格兰杰因果关系值的对数似然比 [59] 可以定义为:
(3)GCXY=Elogfyt+1ytnxtmfyt+1ytn
其中,E 相当于样本空间的期望值。利用递归表示法将高维 copula 转化为一系列低维 copula,可以提供高效且易于实现的格兰杰因果关系估计。根据文献[60],公式(3)的格兰杰因果关系可以转化为
(4)GCXY=Eloghyt+1xtmytnfyt+1ytn×gxtmytn
其中,h 表示两个变量的条件联合密度,f、g 分别表示每个变量的条件边际密度。根据 Sklar 理论和条件 Copula 的密度函数[61],h 可以进一步扩展如下:
(5)hyt+1xtmytn=fyt+1ytn×gxtmytn×cuvytn
其中, u=Fyt+1ytn v=Gxtmytn 。F 和 G 分别是监测变量 Y 和 X 的条件边际分布。结合式(4)和式(5),可以得到 XY 的耦合格兰杰因果关系的简化形式为:
(6)CGCXY=Elogc(Fyt+1ytnG(xtmytn)ytn)

 2.3.埃尔曼网络


ENN [62] 是一种典型的动态递归神经网络。它在隐含层之上增加了一个接管层,作为一步延迟算子用于记忆,使系统能够适应时变特性,增强网络的全局稳定性。ENN 比前馈神经网络具有更强的计算能力,也可用于解决快速优化搜索问题 [63,64]。


ENN 是一种典型的反馈神经网络模型,共有四层:输入层、隐藏层、延迟层和输出层。输入层、隐藏层和输出层之间的连接类似于前馈网络。输入层单元只起信号传输作用,输出层单元起加权作用。隐层单元有线性和非线性两种激励函数,通常激励函数取为 Sigmoid 非线性函数。延迟层用于记忆隐层单元上一时刻的输出值,可视为延迟一步的延迟算子。通过延迟层的延迟和存储,隐藏层的输出与隐藏层的输入自链接。这种自链接使其对历史数据非常敏感,内部反馈网络的加入增加了网络本身处理动态信息的能力,从而达到动态建模的目的。其网络的数学表达式如式(7)所示。
(7)yk=pw3xkxk=s(w1xck+w2uk1xck=xk1
其中,y 是 m 维输出节点向量,x 是 n 维中间层节点单元向量,u 是 r 维输入向量, xc 是 n 维反馈状态向量、 w3 是中间层到输出层的连接权重, w2 是输入层到中间层的连接权重, w1 是延迟层到中间层的连接权重。

 3.方法论


本文提出了一种考虑动态时延效应的短期海上风电预测方法,称为 DTD-Elman,主要由三部分组成:动态滑动窗口确定、非线性数据下的时延计算和基于 ENN 的短期风电预测。首先,设计了一种动态滑动平均周期计算方法,以获得计算非线性数据平均周期的滑动窗口。在此基础上,提出了一种滑动窗口统一方法,以匹配不同变量之间的窗口大小。然后,基于耦合格兰杰因果度量分析计算非线性数据的动态时间延迟,并定义变量间的时间延迟关系。最后,将延迟关系与 Elman 神经网络相结合,从而更准确、更直观地捕捉风力发电信息。拟议策略的详情如图 2 所示。

Fig. 2

  1. 下载 :下载高清图片 (394KB)

  2. 下载 :下载 : 下载全尺寸图片


图 2.拟议的短期风力发电预测策略的结构和细节。


步骤 1:收集原始数据,并根据最大最小归一化方法对其进行归一化处理。


步骤 2:根据 HHT 方法计算每个变量的总体平均周期。


步骤 3:计算每个变量的动态平均周期。


步骤 4:根据公式 (8) 确定每个变量的极值点,并获得相应的阶段平均周期集。


步骤 5:根据第 3.2 节所述的计算过程,统一变量之间的阶段平均周期集合。


步骤 6:根据第 3.3 节介绍的计算过程,计算两个变量之间的动态时延耦合格兰杰因果关系。


步骤 7:划分训练集和测试集,确定 Elman 神经网络的输入和输出。


步骤 8:基于 Elman 神经网络的短期风能预测。


具体实施步骤如图 3 所示。

Fig. 3

  1. 下载 :下载高清图片 (415KB)

  2. 下载 :下载 : 下载全尺寸图片


图 3.拟议战略的具体实施步骤。


3.1.动态平均周期的确定


动态滑动窗口是一种根据数据特征和目标自适应调整窗口大小的方法。它可以根据数据的平均周期和变化情况动态选择合适的窗口大小。这样,动态滑动窗口就能更好地适应不同的数据模式和周期变化。在计算非平稳时间序列的平均周期时,所选择的时间序列长度直接决定了平均周期的值,而每个时间序列的平均周期会随着窗口滑动步长的变化而呈现不同的波动。在这种情况下,选择固定的滑动窗口大小(即只计算一段序列得到的平均周期),如图 4 所示,单变量时间序列的平均周期会随着滑动步长的变化而发生显著变化,并出现几个极端点(如 E1 至 E5)。因此,时延估计中滑动窗口的大小必须充分考虑平均周期的变化,以提高时延估计的有效性和准确性。

Fig. 4

  1. 下载 :下载高清图片 (91KB)

  2. 下载 :下载 : 下载全尺寸图片


图 4 动态平均周期的必要性分析动态平均周期的必要性分析。


在这项工作中,时间序列的平均周期是通过以下公式确定的。
(8)Ap=maxApi=1maxEi1Ei1<i<nmaxApi=n
其中,Ap 代表平均周期序列。由于窗口大小不同,平均周期也会有显著变化,这表明 Ap 值是动态的。项 E 代表平均周期波动曲线上极端点对应的平均周期,i 是极端点的计数。当滑动步骤在第一个极端点之前时,滑动窗口大小设置为第一个极端点之前获得的最大平均周期(例如,当时间序列的相应滑动时间不超过 146 秒时,平均周期必须为 2275,对应于极端值 E1)。


或者,当滑动步长介于两个极端点之间时,由平均周期较大的点确定滑动窗口的大小。例如,当时间序列的滑动时间介于 487 和 566 之间时,平均周期必须取 E3 和 E4 中对应的较大值,即 Ap = 2563)。此外,当滑动步骤在最后一个极值点之后时,滑动窗口的大小设置为第一个极值点之后获得的最大平均周期。例如,当时间序列滑移的相应时间超过 6798 时,平均周期应取 E5 的相应值,即 2624)。最后,就可以得到每个变量对应的平均周期值集。通过匹配数据的平均周期,可以更准确地捕捉周期性变化的特征。不同的时间序列数据可能具有不同的周期模式。通过匹配不同的平均周期窗口,可以根据数据的特点选择合适的窗口大小,从而更好地适应不同的数据模式。动态滑动窗口可以根据实时数据的变化调整窗口大小,实现实时分析和预测。这对于需要及时响应和调整的应用场景非常重要。本节提出的动态平均周期计算方法的伪代码如图 5 所示。

Fig. 5

  1. 下载 :下载高清图片 (411KB)

  2. 下载 :下载 : 下载全尺寸图片


图 5.拟议的动态平均周期计算的伪代码。


3.2.统一滑动窗口


与单一变量动态平均周期相对应的滑动窗口的计算方法已在第 3.1 节中确定,而本节的重点是探讨两个变量之间的因果关系,同时考虑时间延迟效应。因此,有必要统一两个变量之间滑动窗口的大小,相关的伪代码如图 6 和图 7 所示。

Fig. 6

  1. 下载 :下载高清图片 (273KB)

  2. 下载 :下载 : 下载全尺寸图片


图 6.拟议的统一滑动窗口一般方法的伪代码。

Fig. 7

  1. 下载 :下载高清图片 (448KB)

  2. 下载 :下载 : 下载全尺寸图片


图 7.时延协整格兰杰因果关系分析的伪代码。


将 X 和 Y 作为输入时,通过第 3.1 节中每个变量对应阶段平均周期的集合,选择相应时间内较大的平均周期作为统一值。此外,还要对相应阶段的平均周期集进行修改,以实现其统一性。


4.实证研究与分析


在本节中,将通过一个海上风力涡轮机模型实例对所提出的方法进行验证,并与典型方法进行比较,以说明其有效性。


4.1.数据收集和预处理


本文使用的数据来自 2020 年 1 月 10 日至 1 月 19 日连续 10 天海上风力涡轮机的实际正常运行数据。因此,监测变量及其具体说明见附录 A。表中监测的变量,包括转速、电流和变桨角度,有不同的单位和振幅。某 4 天的实际有功功率曲线如图 8 所示。

Fig. 8

  1. 下载 :下载高清图片 (295KB)

  2. 下载 :下载 : 下载全尺寸图片


图 8 有功功率实际曲线有功功率实际曲线。


4.2.动态时延计算


根据第 3 节提出的方法,首先计算每个变量的动态平均周期,如图 9 所示。以变量 1 和 8 为例,随着时间步长的变化,它们的平均周期在大小和振幅上都发生了显著变化。因此,在随后的时延计算中,不适合使用固定时间段内计算出的平均周期作为窗口大小。或者,必须根据不同的时间步长选择相应相位的平均周期。根据公式 (8) 确定极值点,得到与每个监测变量相对应的相位平均周期集。当最大时间步长为 1000 时,如图 10 所示,监测变量 1 的重要极值点分别为 389、585 和 630,分部对应的相位平均周期分别为 532、843 和 868。同样,监测变量 8 的重要极值点分别为 9、626、634 和 668,除法所对应的相位平均周期分别为 564、808 和 786。

Fig. 9

  1. 下载 :下载高清图片 (94KB)

  2. 下载 :下载 : 下载全尺寸图片


图 9.与变量 1 和 8 相对应的动态平均周期。

Fig. 10

  1. 下载 :下载高清图片 (118KB)

  2. 下载 :下载 : 下载全尺寸图片


图 10.变量 1 和 8 对应相位的平均周期。


接下来,统一监测变量 1 和 8 的相应相位的平均周期,结果见图 11。当时间步长≤9 时,滑动窗口大小为 564,用于计算变量 1 和变量 8 之间的动态时延耦合关系。此外,当 9≤ 时间步长≤389 时,窗口大小为 808,直到时间步长达到最设定的最大时间步长。

Fig. 11

  1. 下载 :下载高清图片 (60KB)

  2. 下载 :下载 : 下载全尺寸图片


图 11.协调后监测变量相应阶段的平均周期。


根据第 3.2 节所述的时延耦合格兰杰因果关系计算方法,计算出 35 个监测变量之间的动态时延耦合关系。下表 1 列出了变桨系统中 10 个监测变量与监测变量 23 对应的有功功率之间的动态时延耦合关系。


表 1.动态时延耦合关系的计算结果。


(a) 一些监测变量之间的动态时延耦合关系。(i → 23)
t1–232–233–234–235–236–237–238–239–2310–23
300.4477.4207.4207.4200.7330.3550.6640.7880.7880.788
1200.2496.8526.8526.8520.6360.2130.5470.9990.9990.999
2100.2596.9566.9566.9560.7950.1820.4660.6390.6390.639
3000.4737.5967.5967.5961.0580.6580.7301.2571.2571.257
3600.4117.4067.4067.4061.0900.3350.6840.7030.7030.703


(b) 一些监测变量之间的动态时延耦合关系。(23 → i)
t23–123–223–323–423–523–623–723–823–923–10
300.4635.0195.0195.0190.6640.4820.7001.1291.1291.129
1200.2524.9964.9964.9960.5620.2840.4981.1961.1961.196
2100.2224.9994.9994.9990.7370.2630.6371.0841.0841.084
3000.3965.0165.0165.0161.0120.6570.7691.4061.4061.406
3600.3765.0115.0115.0111.0030.4530.8151.0811.0811.081


(c) 传统共线格兰杰因果关系值
T = 10001–232–233–234–235–236–237–238–239–2310–23
0.2366.7436.7436.7430.6630.1540.4760.5590.5590.559
23–123–223–323–423–523–623–723–823–923–10
0.2274.9924.9924.9920.6640.2280.5791.0121.0121.012


其中,表(a)表示监测变量 1-10 和监测变量 23 之间的动态时延耦合;(b)说明监测变量 23 和监测变量 1-10 之间的动态时延耦合。术语 t 表示时间步长,表中仅列出了 t 取为 30、120、210、300 和 360 时相应的动态时延耦合值。在 t = 300 时,变量之间的动态延时耦合关系发生了显著变化,与 t = 210 时相比,监测变量 6 的值增加了约 300%。


同样,与 t = 210 相比,监测变量 1 的值增加了约 200%,而监测变量 8、9 和 10 的值增加了约 200%。此外,监测变量 8 和 23 之间的耦合关系也发生了显著变化。最初,监测变量 23 对监测变量 8(以及 9 和 10)施加了主要影响,而在 t = 300 时,则出现了相互影响,象征着变量之间微妙的相互作用。


相反,在表(c)中,对 T = 1000 阶段耦合关系的计算未能捕捉到变量间动态延时相互作用的复杂细微差别。变量之间的波动仍未被发现,这进一步凸显了建议方法的功效。这一观察结果强调了该方法识别和描述时间相关性的能力,为监测系统的动态演变提供了宝贵的见解。


上述分析表明,耦合关系的传统格兰杰因果分析方法依赖于根据任意变量对之间的耦合关系计算数值。因此,它无法量化耦合的影响关系。为了解决这一局限性,本文在时间序列中引入了等长高斯白噪声序列,并计算每个监测变量的动态时间延迟。这种方法可以更好地量化不同变量之间的耦合关系。更重要的是,计算结果可用作动态时间延迟的较低阈值,通过将其修正为零来过滤无效的延迟结果。过滤后的结果见附录 B。


4.3.用于电力预测的 Elman 神经网络


在本节中,我们将通过与传统方法的比较来验证所提方法的有效性。此外,由于延迟层的节点数量对模型的性能有很大影响,为了更好地测试和分析延迟层节点数量对模型性能的影响,我们选取了连续 10 天的风电数据来验证所提方法的稳定性,并确定不同风电数据对应的最佳收电层节点数量。


选取 2021 年 1 月某日正常运行的风机的 10,000 个连续数据,并进行归一化处理,以消除幅度不一致的影响。验证实验设置如表 2 所示,其中最优数指延迟层的最优节点数。本文使用的 Elman 神经网络的输入为附录 A 中的前 34 个监测变量,输出为附录 A 中的第 35 个监测变量,即有功功率。激活函数为 Sigmoid 函数,学习率为 0.01。权重为随机初始化和 L1 正则化。使用驱动量梯度下降法和自适应 LR,以均方误差(MSE)来衡量模型的性能。迭代次数为 1000 次,训练目标的最小误差为 0.0001。本文算法均由 MATLAB R2020b 运行,CPU 为英特尔(R)酷睿(TM)i7-10700。数据集总容量的 80% 用作训练集,20% 用作预测集,以验证模型的性能。


表 2.对比实验和分类结果。

Method 最佳数量MAEMAPEMSERMSETime
ENN [65]140. 13400.88302.9500 × 10−20.17184.1775s
CCF-ENN [45]110.00670.06291.0457 × 10−40.01024.2207 s
 WPD-FEEMD-EN [66]130.00400.05320.9106 × 10−40.03025.5735 s
IWT-ENN [67]110.00310.05091.5862 × 10−40.01264.8119 s
 建议的方法100.00190.01766.9578 × 10−60.00264.3219 s


与传统的 Elman 神经网络相比,本文提出的方法在概念上的优势主要体现在两个方面。首先,提出了动态自适应滑动窗口确定方法和统一滑动窗口方法,以探索风力发电机组实际运行数据之间的动态时延关系。该方法可根据实际数据自动学习延时参数,提高预测精度。然而,传统方法大多采用固定时延模型,无法准确捕捉非线性时延关系(如 CCF)。其次,Elman 神经网络的多层非线性映射结构使其具有较强的非线性拟合能力,可有效提高海上风电预测的准确性。值得注意的是,由于输入数据的不同,延迟层的最佳节点数也不同,分别为 14、11、13、11 和 10。Elman 网络的训练过程如图 12 和图 13 所示,在第 129 次迭代时验证性能最好,训练误差为 2.9500 × 10 −2

Fig. 12

  1. 下载 :下载高清图片 (304KB)

  2. 下载 :下载 : 下载全尺寸图片


图 12.Elman 神经网络的训练状态。

Fig. 13

  1. 下载 :下载高清图片 (203KB)

  2. 下载 :下载 : 下载全尺寸图片


图 13.Elman 神经网络的性能。


拟议方法有功功率预测值与实际值的比较如图 14 所示,可以看出它具有非常准确的拟合精度,测试集的训练误差仅为 6.9578 × 10 −6 。图中,0.00335 为均值加标准差线,- 0.00164 为均值减标准差线。

Fig. 14

  1. 下载 :下载高清图片 (260KB)

  2. 下载 :下载 : 下载全尺寸图片


图 14.拟议方法中预测值与实际值的比较。


此外,还选取了连续 10 天的风力发电数据来验证所提方法的稳定性,并确定了不同风力发电数据对应的收电层最佳节点数。结果如表 3 所示。连续 10 天的风力预测结果的平均 MAE 为 0.0025,平均运行时间为 4.0869 s,承接层的最优节点数平均为 12,但该值随输入而变化。为了更好地描述这种差异,图 15 提供了具体的趋势。可以看出,所提出的方法在连续多日预测中具有良好的鲁棒性。此外,所提出的方法在准确预测海上风力涡轮机输出功率方面具有良好的应用潜力。


表 3.DTD-Elman 方法连续 10 天的功率预测结果。

DayMAETime 最佳数量
10.00194.3219 s10
20.00244.7263 s15
30.00173.4497 s13
40.00353.4298 s11
50.00234.1673s7
60.00293.3808 s12
70.00314.9817 s12
80.00374.3106 s8
90.00173.8641 s15
100.00214.2369 s14
Average0.00254.0869 s12
Fig. 15

  1. 下载 :下载高清图片 (372KB)

  2. 下载 :下载 : 下载全尺寸图片


图 15.使用 DTD-Elman 连续 10 天的功率预测趋势。

 5.结论


本文创新性地提出了一种短期风电预测思路,其关键在于探索风电机组实际服务数据之间的动态时延关系。针对常见滑动窗口为静态窗口、变量间滑动窗口差异较大等问题,本文分别提出了动态自适应滑动窗口确定方法和滑动窗口统一方法。在此基础上,提出了基于耦合格兰杰因果度量分析的动态延迟效应估计方法,以刻画变量间的延迟关系。此外,还利用 Elman 神经网络完成了风电预测过程。本文探讨了风电预测问题中建议方法与传统方法的差异,并选取了风力发电机连续 10 天的实际运行数据,进一步计算和验证了建议方法的稳定性和有效性。具体而言,在不增加计算时间的情况下,本文提出的方法显著提高了多个评估指标,并具有较高的预测精度。


虽然基于估计的时间延迟效应,但现有数据可以带来令人满意的预测性能。然而,在风力涡轮机的实际控制中,时间延迟的确定和应用需要与自动发电控制系统合作,而且由于现有技术的限制,第二级甚至更小一级的时间延迟不太容易实现。一个更实用的解决方案是将计算出的时间延迟划分为若干段,并指定可用于工业系统控制策略制定的时间延迟。此外,通过更好地设计现有神经网络的输入-输出和训练策略,建议的动态时间方法可以协同获得更好的预测性能。在未来的工作中,也许可以使用迁移学习和其他方法来提高模型在不同数据集上的性能。总之,还需要做更多的工作来改进所提出的方法。在进一步的研究中,重点应放在提高预测网络的稳定性和协调性以及建议方法的实用性上。


CRediT 作者贡献声明


黄静:写作-原稿、指导、软件、方法、调查、数据整理、概念化。秦蕊写作--审阅和编辑、验证、监督、调查、数据整理、概念化。


利益冲突声明


作者声明,本文的发表不存在利益冲突。

 鸣谢


作者感谢所有匿名审稿人和编辑提出的宝贵建议,这些建议有助于提高本研究的质量。作者还要感谢黄婷对本研究工作的支持。本研究未从公共、商业或非营利部门的资助机构获得任何专项拨款。


附录 A.监测变量及其说明表

Number 监测变量 参数名称Number 监测变量 参数名称
1Rotspd 叶轮转速19Temp_hssbeardrin
高速轴非驱动端的轴承温度
2Pitang 1
1# 叶片俯仰角(俯仰角)
20Temp_gbxoil
齿轮箱油池温度
3Pitang 2
2# 叶片俯仰角(俯仰角)
21Gbxentrypres 齿轮箱入口压力
4Pitang 3
3# 叶片俯仰角(俯仰角)
22Genspd 发电机转速
5Pitgenamp 1 1# 螺距电机电流23Genpowreact 无功功率
6Pitgenamp 2 2# 螺距电机电流24Gentorq 实际扭矩
7Pitgenamp 3 3# 螺距电机电流25Temp_genbeardri