使用深度循环神经网络的雾霾预测模型
和尹丽荣
3
,
∗
3
,
∗
^(3,**) { }^{3, *} 1 绍兴大学生命科学学院,江苏 绍兴 312000;KailinShang1@outbook.com (KS);ziyi.chen.cn@gmail.com (Z.C.) 2 电子科技大学自动化学院,成都 610054;lihong.song.cn@outlook.com (LS);boyang@uestc.edu.cn (B.Y.);shanliu@uestc.edu.cn (S.L.) 3 路易斯安那州立大学地理与人类学系,美国巴吞鲁日,洛杉矶 70803 * 通信方式:liuzhixin@usx.edu.cn (Z.L.);winfirms@uestc.edu.cn (WZ);lyin5@lsu.edu (L.Y.)
学术编辑:陈颖
收稿日期: 2021-11-09 录用日期: 2021-11-29 出版日期:2021 年 12 月 6 日
出版商注:MDPI 对已发布地图和机构隶属关系中的管辖权主张保持中立。
抽象
近年来,雾霾污染频发,严重影响日常生活和生产过程。衡量烟雾污染程度的主要因素是 PM2.5 和 PM10 的浓度。因此,研究 PM2.5/PM10 浓度的预测具有重要意义。由于 PM2.5 和 PM10 浓度数据是时间序列,因此在预测时应考虑它们的时间特征。然而,传统的神经网络受自身结构的限制,在处理与时间相关的数据方面存在一些弱点。循环神经网络是一种专门用于序列数据建模的网络,即序列的当前输出与历史输出相关联。该文基于深度递归神经网络建立了雾霾预测模型。我们从中国空气质量在线监测分析平台获取了成都的空气污染数据,并基于这些数据进行了实验。结果表明,新方法可以更有效、更准确地预测雾霾,并可用于社会和经济目的。
关键词:雾霾预测;PM2.5/PM10;深度递归神经网络
1. 引言
雾霾是中国常见的气象灾害之一,对人们的生产力和生活的各个方面都造成了广泛的影响。在身体健康方面,它影响人们的呼吸系统,大大增加了呼吸系统疾病的可能性,并阻碍了心血管健康。在雾霾天气下,空气中的可吸入颗粒增加了空气流动性差,导致细菌滋生,病毒传播缓慢,病毒在太空范围内的浓度增加,使人们更容易感染疾病。在交通方面,雾霾导致空气能见度低,容易引发交通事故。
由于雾霾的不利影响很多,许多科学家都对雾霾进行了相关研究。Lv, Z. et al. [1] 分析了雾霾的原因,认为它与车辆和其他车辆的尾气排放有关。
Wu
,
J
Wu
,
J
Wu,J \mathrm{Wu}, \mathrm{J} 。等 [2] 从多个角度分析了雾霾的原因。Liu, Y. et al. [3] 研究了雾霾影响下的工业发展问题,指出了雾霾对人类生产和生活的影响,尤其是空气控制工业。因此,雾霾的出现严重干扰了我们的日常生活 [4-6]。
因此,预测雾霾对于防止严重雾霾的发生变得极其重要。Baklanov, A. 和 Zhang, Y. [7] 对 2020 年现代大气成分建模和 AQF(空气质量预报)系统的发展进行了系统介绍和总结。Gao 等[8]在本研究中使用 WRF-CMAQ(天气研究和预报模型和社区多尺度空气质量)建模系统评估了全球定位系统天顶总延迟(GPS-ZTD)数据同化对 NCP 期间气象和气溶胶模拟的影响
2019 年 12 月 1 日至 31 日。Hertwig 等[9,10]在 2015 年开发了拉格朗日色散模型系统,并将其应用于雾霾预测。实验证明该系统可以提供可靠的预测。Liu 等[11,12]分析了 2017 年南京的紫红色雾霾事件。Singh, V. et al. [13] 提出了一种基于共克里金法的空气污染预测方法。该方法已正式应用于米兰市区。
近年来,深度学习在许多领域得到了很好的应用,并逐渐取代了传统方法 [14-17]。与传统技术相比,人工神经网络 [18\u201219] 在雾霾预测领域得到了广泛的应用。Yin 等 [20] 建立了一个多卷积神经网络雾霾预测模型来预测 2021 年的雾霾。Avijoy Chakma 等人在 2017 年提出了一种使用深度卷积神经网络 (CNN) 的方法,该方法根据自然图像的 PM2.5 浓度将其分为不同的类别 [21]。与图像处理的二维数据相比 [22],雾度更适合被视为一种序列数据。Ziyan Zhang 等人在 2021 年提出了一种基于 1D-CNN 的雾霾预测方法 [23]。由于 BP 神经网络具有预测非线性复杂系统的特点,因此 BP 神经网络也被应用于雾霾预测领域。Limei 马等人在 2017 年提出了一种基于 BP 神经网络的雾霾预测方法[24]。由于雾霾数据是一个时间序列,上述方法无法很好地分析数据中的时间关系。因此,专门用于序列分析的 RNN(循环神经网络)已被应用于雾霾预测领域 [25,26]。
在解决实际问题时,隐层的 RNN 模型表示能力有限,多重影响因素下的雾霾预测结果并不优异。为解决上述问题,设计了基于深度循环神经网络的雾霾预测系统,选择基于时间的反向传播算法训练预测模型,并完成了 PM2.5 和 PM10 预测实验。结果表明,该模型具有较高的可行性和合理性,获得了准确可靠的结果,为相关部门改进空气监测提供了有价值的参考。
2. 材料和方法
本研究从成都市空气质量在线监测分析平台 https: / /www.aqistudy.cn 网站收集了成都市 6 个监测站的空气污染数据(2018 年 3 月 17 日访问)。
这六个监测站分别位于成都的沙河埔、梁家巷、君平街、草塘寺、三瓦窑和十里店。监测站提供的数据是 PM2.5、
O
3
,
CO
,
NO
2
O
3
,
CO
,
NO
2
O_(3),CO,NO_(2) \mathrm{O}_{3}, \mathrm{CO}, \mathrm{NO}_{2} PM10 和
SO
2
SO
2
SO_(2) \mathrm{SO}_{2} 的浓度,其中 PM2.5 的测量单位为 ,
PM
10
,
O
3
PM
10
,
O
3
PM10,O_(3) \mathrm{PM} 10, \mathrm{O}_{3} 而
SO
2
SO
2
SO_(2) \mathrm{SO}_{2}
NO
2
NO
2
NO_(2) \mathrm{NO}_{2} 和 则
(
μ
g
/
m
3
)
μ
g
/
m
3
(mug//m^(3)) \left(\mu \mathrm{g} / \mathrm{m}^{3}\right) 以 和 为单位测量
(
mg
/
m
3
)
mg
/
m
3
(mg//m^(3)) \left(\mathrm{mg} / \mathrm{m}^{3}\right) 。监控数据更新频率为每小时 1 次。以上 6 个监测点在成都市区的地理位置如图 1 所示。
本研究通过 Python Software Foundation 使用 Python 2.70 编写爬虫代码,收集了上述监测点从 2014 年 6 月 1 日至 2017 年 6 月 30 日的统计数据。6 个监测点的平均数据用于表示成都市的空气质量,共计 26,120 条数据。数据格式如表 1 所示。
2.1. 平均完成数据
如表 1 所示,原始数据在某个时间缺失。我们使用均值插值法来完成一些缺失数据。具体方法如公式 (1) 所示:
X
t
=
1
2
(
X
t
−
1
+
X
t
+
1
)
X
t
=
1
2
X
t
−
1
+
X
t
+
1
X_(t)=(1)/(2)(X_(t-1)+X_(t+1)) X_{t}=\frac{1}{2}\left(X_{t-1}+X_{t+1}\right)
X
t
X
t
X_(t) X_{t} 表示当前时间缺失的天气数据,
X
t
−
1
X
t
−
1
X_(t-1) X_{t-1} 表示前一刻的天气数据,
X
t
+
1
X
t
+
1
X_(t+1) X_{t+1} 表示之后某个时间的天气数据。
插值后,本研究共使用了 27,024 个有效数据。
图 1.监控点的地理位置。 表 1.数据格式。
时间
PM2.5 (
μ
g
/
m
3
μ
g
/
m
3
mug//m^(3) \mu \mathrm{g} / \mathrm{m}^{3} )
PM10 (
μ
g
/
m
3
μ
g
/
m
3
mug//m^(3) \mu \mathrm{g} / \mathrm{m}^{3} )
CO
(
mg
/
m
3
)
CO
mg
/
m
3
CO(mg//m^(3)) \mathrm{CO}\left(\mathrm{mg} / \mathrm{m}^{3}\right)
NO
2
(
mg
/
m
3
)
NO
2
mg
/
m
3
NO_(2)(mg//m^(3)) \mathrm{NO}_{2}\left(\mathrm{mg} / \mathrm{m}^{3}\right)
O
3
(
μ
g
/
m
3
)
O
3
μ
g
/
m
3
O_(3)(mu(g)//m^(3)) \mathrm{O}_{3}\left(\mu \mathrm{~g} / \mathrm{m}^{3}\right)
SO
2
(
μ
g
/
m
3
)
SO
2
μ
g
/
m
3
SO_(2)(mu(g)//m^(3)) \mathrm{SO}_{2}\left(\mu \mathrm{~g} / \mathrm{m}^{3}\right)
2014年6月1日 上午 0:00
89
130
0.8
36
129
19
2014 年 6 月 1 日 1:00
86
120
0.9
54
91
16
2014 年 6 月 1 日 下午 2:00
0
0
0
0
0
0
1 六月 2014 3:00
71
111
0.8
35
97
17
Time PM2.5 ( mug//m^(3) ) PM10 ( mug//m^(3) ) CO(mg//m^(3)) NO_(2)(mg//m^(3)) O_(3)(mu(g)//m^(3)) SO_(2)(mu(g)//m^(3))
1 June 2014 0:00 89 130 0.8 36 129 19
1 June 2014 1:00 86 120 0.9 54 91 16
1 June 2014 2:00 0 0 0 0 0 0
1 June 2014 3:00 71 111 0.8 35 97 17 | Time | PM2.5 ( $\mu \mathrm{g} / \mathrm{m}^{3}$ ) | PM10 ( $\mu \mathrm{g} / \mathrm{m}^{3}$ ) | $\mathrm{CO}\left(\mathrm{mg} / \mathrm{m}^{3}\right)$ | $\mathrm{NO}_{2}\left(\mathrm{mg} / \mathrm{m}^{3}\right)$ | $\mathrm{O}_{3}\left(\mu \mathrm{~g} / \mathrm{m}^{3}\right)$ | $\mathrm{SO}_{2}\left(\mu \mathrm{~g} / \mathrm{m}^{3}\right)$ |
| :---: | :---: | :---: | :---: | :---: | :---: | :---: |
| 1 June 2014 0:00 | 89 | 130 | 0.8 | 36 | 129 | 19 |
| 1 June 2014 1:00 | 86 | 120 | 0.9 | 54 | 91 | 16 |
| 1 June 2014 2:00 | 0 | 0 | 0 | 0 | 0 | 0 |
| 1 June 2014 3:00 | 71 | 111 | 0.8 | 35 | 97 | 17 |
2.2. 标准化数据处理
从表 1 中可以看出,收集到的 6 个数据在数值范围上存在很大差异。值较大的数据将增加模型在神经网络中的影响力比例,并削弱值较低的数据特征。为避免数值范围不同造成的误差,本研究对上述数据进行了归一化处理。所有数据均标准化为 -1 和 1 之间,如公式 (2) 所示:
X
′
=
X
−
X
¯
X
max
−
X
min
X
′
=
X
−
X
¯
X
max
−
X
min
X^(')=(X-( bar(X)))/(X_(max)-X_(min)) X^{\prime}=\frac{X-\bar{X}}{X_{\max }-X_{\min }}
其中,
X
′
X
′
X^(') X^{\prime} 表示标准化过程完成后的天气数据集。
X
X
X X 表示原始 weather 数据集,并
X
¯
X
¯
bar(X) \bar{X} 指示 weather 数据集的平均值。
X
max
X
max
X_(max) X_{\max } 表示 weather 数据集的最大值,
X
min
X
min
X_("min ") X_{\text {min }} 表示 weather 数据集的最小值。
在后续的实验中,我们将使用整个数据集中的第一个
80
%
80
%
80% 80 \% 作为测试集,下一个
10
%
10
%
10% 10 \% 作为验证集,最后一个
10
%
10
%
10% 10 \% 作为测试集。按时间划分。
2.3. 方法
递归神经网络,简称 RNN,是一类用于处理序列数据的神经网络 [27]。序列数据是指一类能够反映某种现象或某物的程度的数据,前后数据之间存在着密切的联系。RNN 包括输入层、隐藏层、输出层,隐藏层起着最重要的作用,隐藏层此时不仅包括输入层的输出, 而且输出也就其前一刻,RNN 处理的序列数据主要体现在内存、数据信息的特点上,应用到输出中,因为 RNN 深度反映了输入和输出的过程,所以也叫深度网络,下面是 RNN 的模型发展图(图 2)。
图 2.递归神经网络的模型扩展图。 与仅在层之间建立连接的通用神经网络不同,RNN 还在层之间的神经元之间进行连接。我们可以将隐藏层作为整个网络的存储空间,当 RNN 展开时,我们发现它可以用来监督分类学习循环神经网络,引入一个记住先前信息并应用的定向神经网络,这本质上区别于传统的前馈神经网络。对于传统的神经网络,它可以更高效地训练样本,更真实、更可信地模拟复杂的特征关系。RNN 使用反向传播方法根据网络传播的时间和顺序计算正向传播过程 [28]。
然而,在实际问题解决中,RNN 仍然不足,表达能力有限,隐层无法表达整个模型,因此在本文中,在预测 PM2.5 和 PM10 的浓度情景时,设计了深度递归神经网络,以更好地完成 PM2.5 和 PM10 浓度的预测。比其他方法更深入地研究 RNN 的三个方面:对隐藏功能的输入;hidden 到 output 功能;和 hidden 到 hidden 的转变 [29]。由于深度递归网络模型的深度主要体现在隐藏层中,我们从隐藏层开始,通过改变隐藏层的数量和单位来确定最佳模型[30](图 3)。
图 3.PM2.5 预测模型深度递归神经网络的网络结构。
2.4. 深度递归神经网络训练过程
递归神经网络可以通过时间存储功能对很久以前的信息进行编码。在深度递归神经网络的训练过程中,训练时间反向传播算法以将其应用于递归层。对于错误 由反向传播算法生成,我们向前一层传输到当前层和前一层传输到以下两个方向传播: (1) 定义注释(表 2)
表 2.注释定义表。
神经层
描述
索引变量
x
(
t
)
x
(
t
)
x(t) \mathbf{x ( t )}
输入层
i
s
(
t
−
1
)
s
(
t
−
1
)
s(t-1) \mathbf{s ( t}-\mathbf{1})
Previous time hidden layer state | Previous time hidden layer state |
| :---: |
h
s
(
t
)
s
(
t
)
s(t) \mathbf{s ( t )}
在当前时间隐藏图层状态
Hide layer state at the current
time | Hide layer state at the current |
| :---: |
| time |
j
y
(
t
)
y
(
t
)
y(t) \mathbf{y}(\mathbf{t})
输出层
k
T
h
e
w
e
i
g
h
t
m
a
t
r
i
x
T
h
e
w
e
i
g
h
t
m
a
t
r
i
x
Theweightmatrix \mathbf{T h e ~ w e i g h t ~ m a t r i x ~}
描述
索引变量
V
V
V \mathbf{V}
输入层到输出层
h
,
j
h
,
j
h,j \mathrm{h}, \mathrm{j}
U
U
U \mathbf{U}
previous time hidden layer 设置为
隐藏层
j
,
k
j
,
k
j,k \mathrm{j}, \mathrm{k}
Nerve Layer Describe Index Variable
x(t) The input layer i
s(t-1) "Previous time hidden layer state" h
s(t) "Hide layer state at the current
time" j
y(t) Output layer k
Theweightmatrix Describes Index Variables
V Input layer to output layer h,j
U Previous time hidden layer to
hidden layer j,k | Nerve Layer | Describe | Index Variable |
| :---: | :---: | :---: |
| $\mathbf{x ( t )}$ | The input layer | i |
| $\mathbf{s ( t}-\mathbf{1})$ | Previous time hidden layer state | h |
| $\mathbf{s ( t )}$ | Hide layer state at the current <br> time | j |
| $\mathbf{y}(\mathbf{t})$ | Output layer | k |
| $\mathbf{T h e ~ w e i g h t ~ m a t r i x ~}$ | Describes | Index Variables |
| $\mathbf{V}$ | Input layer to output layer | $\mathrm{h}, \mathrm{j}$ |
| $\mathbf{U}$ | Previous time hidden layer to | |
| hidden layer | $\mathrm{j}, \mathrm{k}$ | |
根据图 4a,训练网络需要以下处理。
图 4.经典递归神经网络 (RNN) 模型 (a) 简单的 RNN;(b) 扩展的 RNN。 input 层
→
→
rarr \rightarrow 是隐藏层。如公式 (3) 和 (4) 所示:
s
j
(
t
)
=
f
(
net
j
(
t
)
)
s
j
(
t
)
=
f
(
net
j
(
t
)
)
s
j
(
t
)
=
f
net
j
(
t
)
s
j
(
t
)
=
f
net
j
(
t
)
{:[s_(j)(t)=f(" net "_(j)(t))],[s_(j)(t)=f(net_(j)(t))]:} \begin{aligned}
& s_{j}(t)=f\left(\text { net }_{j}(t)\right) \\
& s_{j}(t)=f\left(\operatorname{net}_{j}(t)\right)
\end{aligned}
隐藏层
→
→
rarr \rightarrow 为输出层。如公式 (5) 和 (6) 所示:
y
k
(
t
)
=
g
(
net
k
(
t
)
)
net
k
(
t
)
=
∑
j
m
s
j
(
t
)
w
k
j
+
b
k
y
k
(
t
)
=
g
net
k
(
t
)
net
k
(
t
)
=
∑
j
m
s
j
(
t
)
w
k
j
+
b
k
{:[y_(k)(t)=g(net_(k)(t))],[net_(k)(t)=sum_(j)^(m)s_(j)(t)w_(kj)+b_(k)]:} \begin{gathered}
y_{k}(t)=g\left(\operatorname{net}_{k}(t)\right) \\
\operatorname{net}_{k}(t)=\sum_{j}^{m} s_{j}(t) w_{k j}+b_{k}
\end{gathered}
其中 f 和 g 分别是隐藏层的激活函数和输出层。激活函数保证了整个神经网络的非线性,显著提高了其表达能力。
b
j
b
j
b_(j) b_{j} 和
b
k
b
k
b_(k) b_{k} 是偏差。 (2) 选择损失函数和激活函数
本文选择方差和函数作为训练神经网络的损失函数,如公式 (7) 所示:
C
=
1
2
∑
p
n
∑
k
o
(
d
p
k
−
y
p
k
)
2
C
=
1
2
∑
p
n
∑
k
o
d
p
k
−
y
p
k
2
C=(1)/(2)sum_(p)^(n)sum_(k)^(o)(d_(pk)-y_(pk))^(2) C=\frac{1}{2} \sum_{p}^{n} \sum_{k}^{o}\left(d_{p k}-y_{p k}\right)^{2}
(3) 沿时间的反向传播算法
设计一个超过 2 层的神经网络来捕获更长的历史信息,以进一步传输误差(图 4b)。因此,误差的向后传播可以定义为方程 (8) 和 (9):
δ
=
−
∂
(
C
)
∂
(
n
e
t
)
δ
p
j
(
t
−
1
)
=
∑
h
m
δ
p
h
(
t
)
u
h
j
f
′
(
s
p
j
(
t
−
1
)
)
δ
=
−
∂
(
C
)
∂
(
n
e
t
)
δ
p
j
(
t
−
1
)
=
∑
h
m
δ
p
h
(
t
)
u
h
j
f
′
s
p
j
(
t
−
1
)
{:[delta=-(del(C))/(del(net))],[delta_(pj)(t-1)=sum_(h)^(m)delta_(ph)(t)u_(hj)f^(')(s_(pj)(t-1))]:} \begin{gathered}
\delta=-\frac{\partial(C)}{\partial(n e t)} \\
\delta_{p j}(t-1)=\sum_{h}^{m} \delta_{p h}(t) u_{h j} f^{\prime}\left(s_{p j}(t-1)\right)
\end{gathered}
其中
h
h
h h 是时间步长为
t
t
t t 时的隐藏层节点索引,
j
j
j j 是 时间步长为
t
−
1
t
−
1
t-1 t-1 时的隐藏层节点索引。 (4) 权重矩阵更新计算
为简洁起见,此处未将训练样本的索引
p
p
p p 添加到我们的品种中。然后,输出层的误差表示为方程 (10):
e
o
(
t
)
=
d
(
t
)
−
y
(
t
)
e
o
(
t
)
=
d
(
t
)
−
y
(
t
)
e_(o)(t)=d(t)-y(t) e_{o}(t)=d(t)-y(t)
输出层权重表示为公式 (11):
W
(
t
+
1
)
=
W
(
t
)
+
η
s
(
t
)
e
o
(
t
)
T
W
(
t
+
1
)
=
W
(
t
)
+
η
s
(
t
)
e
o
(
t
)
T
W(t+1)=W(t)+eta s(t)e_(o)(t)^(T) W(t+1)=W(t)+\eta s(t) e_{o}(t)^{T}
误差梯度从输出层传播到隐藏层。如公式 (12) 所示:
e
h
(
t
)
=
d
h
(
e
o
(
t
)
T
V
,
t
)
e
h
(
t
)
=
d
h
e
o
(
t
)
T
V
,
t
e_(h)(t)=d_(h)(e_(o)(t)^(T)V,t) e_{h}(t)=d_{h}\left(e_{o}(t)^{T} V, t\right)
用方程 (13) 获得误差向量:
d
h
j
(
x
,
t
)
=
x
f
′
(
net
j
)
d
h
j
(
x
,
t
)
=
x
f
′
net
j
d_(hj)(x,t)=xf^(')(" net "_(j)) d_{h j}(x, t)=x f^{\prime}\left(\text { net }_{j}\right)
权重矩阵
V
V
V V 的计算方式如公式 (14) 所示:
V
(
t
+
1
)
=
V
(
t
)
+
η
x
(
t
)
e
h
(
t
)
T
V
(
t
+
1
)
=
V
(
t
)
+
η
x
(
t
)
e
h
(
t
)
T
V(t+1)=V(t)+eta x(t)e_(h)(t)^(T) V(t+1)=V(t)+\eta x(t) e_{h}(t)^{T}
循环权重矩阵 W 的计算方式如公式 (15) 所示:
U
(
t
+
1
)
=
U
(
t
)
+
η
s
(
t
−
1
)
e
h
(
t
)
T
U
(
t
+
1
)
=
U
(
t
)
+
η
s
(
t
−
1
)
e
h
(
t
)
T
U(t+1)=U(t)+eta s(t-1)e_(h)(t)^(T) U(t+1)=U(t)+\eta s(t-1) e_{h}(t)^{T}
研究过程预测 PM2.5 浓度、过去 24 小时的 PM2.5 密度输入、PM10 的当前时刻,
O
3
,
CO
,
NO
2
O
3
,
CO
,
NO
2
O_(3),CO,NO_(2) \mathrm{O}_{3}, \mathrm{CO}, \mathrm{NO}_{2} 并
SO
2
SO
2
SO_(2) \mathrm{SO}_{2} 输出以预测 PM2.5 密度的时刻。因此,输入层神经元的数量为 29。输出层神经元的数量为 1 。与预测 PM10 浓度相同,只需将 PM10 的输入数据更改为 PM2.5 即可。
2.5. 评估
本研究的主要内容是通过改变隐藏层的数量和每个隐藏层中的神经单元数量来构建不同的深度神经网络预测模型,并探讨其对 PM2.5/PM10 预测精度的影响。
在本研究中,我们使用均方根误差 (RMSE) 作为评价指标 [31-33]。公式为方程 (16):
R
M
S
E
=
1
m
∑
i
m
(
T
i
−
P
i
)
2
R
M
S
E
=
1
m
∑
i
m
T
i
−
P
i
2
RMSE=sqrt((1)/(m)sum_(i)^(m)(T_(i)-P_(i))^(2)) R M S E=\sqrt{\frac{1}{m} \sum_{i}^{m}\left(T_{i}-P_{i}\right)^{2}}
其中,
i
i
i i 表示测试样本点的数量,
m
m
m m 并表示估计的总天数。
T
i
T
i
T_(i) T_{i} 是检验采样点的实际浓度。
P
i
P
i
P_(i) P_{i} 是检验采样点的预测浓度。
将实验结果与实际数据进行 360 次对比。选择不同的隐藏层,比较不同隐藏层对模型预测精度的影响。对于不同的隐藏层,采用神经元数分析预测模型。
在本研究中,隐藏层节点的数量是根据经验公式
l
=
m
+
n
+
α
l
=
m
+
n
+
α
l=sqrt(m+n)+alpha l=\sqrt{m+n}+\alpha 确定的。该参数
m
m
m m 表示输入层节点的数量,
n
n
n n 表示输出层节点的数量,
α
α
alpha \alpha 是小于 10 的正常数,
l
l
l l 表示隐藏层神经元的数量。此外,由于此模型的输入是
24
+
5
24
+
5
24+5 24+5 (
24
−
h
24
−
h
24-h 24-\mathrm{h} PM2.5 浓度值,以及当前时刻的其他 5 个污染物浓度值),因此输出节点为 1 。
因此,隐藏神经元的数量在 6-16 个之间。在这个模型中,我们选择了 10 作为神经元的初始数量,它随着隐藏层的增加而逐步减少。
隐藏层的数量和神经元的分布如表 3 所示: 表 3.隐藏层的数量和神经元的分布。
隐藏图层
神经元分布
1
10
2
109
3
1098
4
10987
5
109876
6
1098765
7
10987654
8
109876543
Hidden Layers Neuron Distribution
1 10
2 109
3 1098
4 10987
5 109876
6 1098765
7 10987654
8 109876543 | Hidden Layers | Neuron Distribution |
| :---: | :---: |
| 1 | 10 |
| 2 | 109 |
| 3 | 1098 |
| 4 | 10987 |
| 5 | 109876 |
| 6 | 1098765 |
| 7 | 10987654 |
| 8 | 109876543 |
每组实验进行 5 次,选取平均值作为实验结果进行分析。
在此过程中,PM2.5/PM10 浓度值分为 6 个等级,以进一步解释实验结果。PM2.5/PM10 浓度值的分类如表 4 所示。
表 4.PM2.5/PM10 浓度值的分类。
水平
1 级
2 级
3 级
4 级
5 级
6 级
级别范围
(
0
−
35
)
(
0
−
35
)
(0-35) (0-35)
(
36
−
75
)
(
36
−
75
)
(36-75) (36-75)
(
76
−
115
)
(
76
−
115
)
(76-115) (76-115)
(
116
−
150
)
(
116
−
150
)
(116-150) (116-150)
(
151
−
250
)
(
151
−
250
)
(151-250) (151-250)
(
>
250
)
(
>
250
)
( > 250) (>250)
Level Level 1 Level 2 Level 3 Level 4 Level 5 Level 6
Level range (0-35) (36-75) (76-115) (116-150) (151-250) ( > 250) | Level | Level 1 | Level 2 | Level 3 | Level 4 | Level 5 | Level 6 |
| :---: | :---: | :---: | :---: | :---: | :---: | :---: |
| Level range | $(0-35)$ | $(36-75)$ | $(76-115)$ | $(116-150)$ | $(151-250)$ | $(>250)$ |
假设预测结果和实际测量值处于同一等级。在这种情况下,预测结果被判断为优越。假设预测结果和实际测量值位于两个相邻的等级中。预测结果被判断为可接受。假设预测结果与实际测量值相差两个等级以上。预测结果被判定为不可接受。
3. 结果
RNN 模型预测的结果和优化是通过改变隐藏层的数量来实现的。
预测结果如表 5 所示。结果显示了具有不同隐藏层和神经元分布数量的 RMSE 和最优评估。
表 5.深度 RNN 模型预测结果。
隐藏图层
神经元分布
RMSE (
μ
g
/
m
3
μ
g
/
m
3
mug//m^(3) \mu \mathrm{g} / \mathrm{m}^{3} )
最佳的
可以接受
无法接受
PM2.5
PM10
PM2.5
PM10
PM2.5
PM10
PM2.5
PM10
1
10
12.59
19.29
78.89%
76.11%
20.83%
23.06%
0.28%
0.83%
2
109
10.26
18.91
81.39%
74.72%
18.33%
24.72%
0.28%
0.56%
3
1098
9.93
17.11
80.83%
81.11%
18.89%
18.33%
0.28%
0.56%
4
10987
9.31
17.00
83.33%
78.89%
16.67%
20.56%
0.00%
0.56%
5
109876
8.89
16.87
85.83%
78.06%
14.17%
21.39%
0.00%
0.56%
6
1098765
8.81
16.62
85.83%
76.67%
14.17%
23.06%
0.00%
0.28%
7
10987654
10987654
10987654 10987654
8.69
16.62
86.11%
82.78%
13.89%
16.94%
0.00
%
0.00
%
0.00% 0.00 \%
0.28
%
0.28
%
0.28% 0.28 \%
8
109876543
8.63
15.99
85.00%
83.89%
15.00%
16.11%
0.00%
0.00%
Hidden Layers Neuron Distribution RMSE ( mug//m^(3) ) Optimal Acceptable Unacceptable
PM2.5 PM10 PM2.5 PM10 PM2.5 PM10 PM2.5 PM10
1 10 12.59 19.29 78.89% 76.11% 20.83% 23.06% 0.28% 0.83%
2 109 10.26 18.91 81.39% 74.72% 18.33% 24.72% 0.28% 0.56%
3 1098 9.93 17.11 80.83% 81.11% 18.89% 18.33% 0.28% 0.56%
4 10987 9.31 17.00 83.33% 78.89% 16.67% 20.56% 0.00% 0.56%
5 109876 8.89 16.87 85.83% 78.06% 14.17% 21.39% 0.00% 0.56%
6 1098765 8.81 16.62 85.83% 76.67% 14.17% 23.06% 0.00% 0.28%
7 10987654 8.69 16.62 86.11% 82.78% 13.89% 16.94% 0.00% 0.28%
8 109876543 8.63 15.99 85.00% 83.89% 15.00% 16.11% 0.00% 0.00% | Hidden Layers | Neuron Distribution | RMSE ( $\mu \mathrm{g} / \mathrm{m}^{3}$ ) | | Optimal | | Acceptable | | Unacceptable | |
| :---: | :---: | :---: | :---: | :---: | :---: | :---: | :---: | :---: | :---: |
| | | PM2.5 | PM10 | PM2.5 | PM10 | PM2.5 | PM10 | PM2.5 | PM10 |
| 1 | 10 | 12.59 | 19.29 | 78.89% | 76.11% | 20.83% | 23.06% | 0.28% | 0.83% |
| 2 | 109 | 10.26 | 18.91 | 81.39% | 74.72% | 18.33% | 24.72% | 0.28% | 0.56% |
| 3 | 1098 | 9.93 | 17.11 | 80.83% | 81.11% | 18.89% | 18.33% | 0.28% | 0.56% |
| 4 | 10987 | 9.31 | 17.00 | 83.33% | 78.89% | 16.67% | 20.56% | 0.00% | 0.56% |
| 5 | 109876 | 8.89 | 16.87 | 85.83% | 78.06% | 14.17% | 21.39% | 0.00% | 0.56% |
| 6 | 1098765 | 8.81 | 16.62 | 85.83% | 76.67% | 14.17% | 23.06% | 0.00% | 0.28% |
| 7 | $10987654$ | 8.69 | 16.62 | 86.11% | 82.78% | 13.89% | 16.94% | $0.00 \%$ | $0.28 \%$ |
| 8 | 109876543 | 8.63 | 15.99 | 85.00% | 83.89% | 15.00% | 16.11% | 0.00% | 0.00% |
图 5 和图 6 是 RNN 模型分别在 5 个和 8 个隐藏层数上对 PM 2.5 的预测比较。
图 5.RNN 网络 5 个隐藏层的 PM2.5 预测结果。
图 6.RNN 网络 8 个隐藏层的 PM2.5 预测结果。
图 7 和图 8 分别是 5 个和 7 个隐藏层数下的 PM 10 和 RNN 模型的实际结果的比较。经过对比,该模型误差小,预测精度高。
图 7.RNN 网络 5 个隐藏层的 PM10 预测结果。
图 8.RNN 网络 7 个隐藏层的 PM10 预测结果。
4. 讨论
针对 PM2.5/PM10 浓度预测问题,本文构建了一个由 RNN 组成的深度循环神经网络。它预测了成都市区的 PM2.5/PM10 浓度。根据预测,对结果进行分析。结果表明,在其他条件相同的情况下,隐藏层越多,预测精度越高。当达到特定值时,准确率大致相同;在同一网络下,PM2.5 的预测精度显著高于 PM10。
以往关于 PM2.5/PM10 预测的研究大多使用线性回归方法,但实际上,这些因素之间的关系相当复杂,而且往往是非线性的。因此,本文采用深度学习理论构建了雾霾预测模型。深度循环神经网络预测模型和深度 长期记忆预测模型预测短期内 PM2.5/PM10 浓度。深度递归神经网络具有诸多优势,参数预测能力强于其他神经网络,预测结果准确率更高。RNN 和长期记忆预测模型是循环网络的例子,它们以前一层的隐藏状态为输入,生成当前层的隐藏状态作为输出,从而提高了其预测精度和更大的数据处理范围 [34]。与普通结构的通用模型相比,充分考虑了数据随时间序列变化的动态特性 [35]。
然而,研究工作仍处于初步阶段。仍有许多问题可以进一步研究。 (1)在 PM2.5/PM10 浓度预测中,本文放弃了底部相关性的气象数据。相反,高度相关的 PM2.5、
O
3
,
CO
,
NO
2
O
3
,
CO
,
NO
2
O_(3),CO,NO_(2) \mathrm{O}_{3}, \mathrm{CO}, \mathrm{NO}_{2} PM10 和
SO
2
SO
2
SO_(2) \mathrm{SO}_{2} 被选为变量来训练预测模型。因此,无法探究导致 PM2.5 污染的因素 [36]。雾霾形成的场景无法高精度预测,对实验预测结果有一定影响。如何利用导致 PM2.5/PM1s0 污染的因素提高准确性并研究实验预测有待进一步改进。 (2)本文仅给出了成都市 PM2.5/PM10 浓度的预测实验。由于地理环境的原因,当地的气候和雾霾污染情况不同,预测结果可能也不尽相同,因此在本实验中,最佳模型预测结果可能不适用于其他城市,要确定其他地区的最佳预测模型,需要在该模式下重新训练 [37]。因此,如何找到合适的多区域雾霾预测模型仍需研究,思考进一步扩大研究范围到中国,做出 PM2.5/PM10 浓度变化的预测。 (3)本文选择的时间尺度较小,对 PM2.5/PM10 的预测只是短期预测,预测模型设计没有滑动,因此预测模型效应仅适用于短期雾霾天气下 PM2.5/PM10 浓度含量的预测,不能直接用于预测未来的长期结果。相反,短期预测被用作预测 PM2.5/PM10 长期浓度的变量[38,39]。下一步,我们将选择长期尺度和 PM2.5 /PM10 浓度含量范围,提高到重污染程度,并对重度雾霾区进行时间序列分析,研究其发展机制[40,41]。
5. 结论
本文对采集到的数据进行了插值补全和数据标准化。对处理后的数据进行相关性分析。根据相关系数对数据进行四舍五入。最终选择 PM2.5 、 PM10
O
3
,
CO
,
NO
2
O
3
,
CO
,
NO
2
O_(3),CO,NO_(2) \mathrm{O}_{3}, \mathrm{CO}, \mathrm{NO}_{2} 和
SO
2
SO
2
SO_(2) \mathrm{SO}_{2} 浓度作为预测 PM2.5 和 PM10 的输入变量。选择相同的训练数据集和测试集来构建 RNN 的深度递归神经网络。实验结论如下: (1) PM2.5 和 PM10 的预测结果与隐藏层数有关。隐藏层的数量越多,预测精度越高。因此,PM2.5 的预测效果高于 PM10,这与 PM2.5 和 PM10 的数据特征有关。由于 PM2.5 的浓度数据低于 PM10,且浓度范围较小,因此 RMS 误差小,精度高。 (2)根据 PM2.5 的预测结果,在确定节点数的情况下,预测精度与隐藏层数有关。深度循环神经网络的预测结果如下:随着隐藏层数量的增加,预测精度越高,具有 8 个隐藏层的深度循环神经网络的预测结果最好。 (3) 根据 PM10 预测结果,与 PM2.5 预测结果一样,预测精度与隐藏层的数量有关。隐藏图层的数量越多,预测精度就越高。具有 8 个隐藏层的深度递归神经网络的预测结果最好。 (4) 为保证预测精度,选择最简化的神经网络来预测 PM2.5/PM10。当使用具有 7 个隐藏层的深度递归神经网络预测 PM2.5/PM10 时,可以获得良好的结果。
作者贡献:概念化、WZ 和 Z.L.;方法论,L.Y. 和 S.L.;软件,Z.C. 和 B.Y.;形式分析,B.Y. 和 L.S.;数据管理,K.S.、Z.C. 和 L.S.;写作 - 原始草稿准备,KS 和 SL;写作审查和编辑,L.Y. 和 W.Z.;资金获取,W.Z.所有作者均已阅读并同意手稿的已发表版本。 基金资助: 本工作由四川省科技计划项目 (2021YFQ0003) 联合支持。
机构审查委员会声明:不适用。 知情同意书:不适用。 数据可用性声明:数据集可在成都市环境保护局提供的成都空气质量在线监测分析平台(https:/ / www.aqistudy.cn,2018 年 3 月 17 日访问)上获得。 利益冲突:作者声明没有利益冲突。
引用
吕,Z.;王 X.;邓,F.;英,Q.;阿奇博尔德,A.T.;琼斯,RL;丁 Y.;程 Y.;傅 M.;刘 Y.;等人 COVID-19 封锁期间北京的交通停止和雾霾加剧揭示了源-受体关系。环境。科学技术 2020, 54, 15660-15670.[交叉引用][公共医学]
吴 J.;张 P.;易 H.;秦 Z.雾霾污染的成因是什么?中国城市 PM2.5 浓度的实证研究。可持续性 2016, 8, 132。[交叉引用]
刘 Y.;董 F.工业转移过程如何影响中国雾霾污染:空间效应视角分析.国际环境杂志。公共卫生 2019, 16, 423。[交叉引用][公共医学]
李 X.;郑 W.;尹, L.;尹,Z.;宋 L.;Tian, X. 社会经济活动对中国北京空气污染物的影响.打开 Geosci。2017, 9, 314-321.[交叉引用]
郑 W.;李 X.;尹, L.;基于空间分析的中国城市空气污染时空异质性.撕裂。林采 2016, 27, 351-356。[交叉引用]
郑 W.;李 X.;谢 J.;尹, L.;Wang, Y. 基于灰色关系分析的人类活动对北京雾霾的影响.撕裂。林采 2015, 26, 187-192。[交叉引用]
巴克拉诺夫,A.;Zhang, Y. 空气质量建模和预测的进展。全球。通过。2020, 2, 261-270.[交叉引用]
高 L.;刘 Z.;陈 D.;严,P.;张 Y.;胡 H.;梁 H.;GPS-ZTD 数据同化及其对 WRF 3DVAR 和 CMAQ 建模系统华北平原冬季雾霾预测的影响。环境。Sci. 污染。2021 年决议,1-16。[交叉引用][公共医学]
尹, L.;李 X.;郑 W.;尹,Z.;宋 L.;葛,L.;Zeng, Q. 环太平洋地震带地震活动时空分布的分形维数分析。地球系统科学杂志 2019, 128, 22.[交叉引用]
赫特维格,D.;布尔金,L.;甘,C.;霍特,M.;琼斯,A.;肖,F.;威瑟姆,C.;Zhang, K. 开发和演示拉格朗日色散建模系统,用于实时预测东南亚生物质燃烧产生的烟霾污染。J. 地球物理学。Res. Atmos. 2015, 120, 12605-12630.[交叉引用]
郑 W.;李 X.;尹, L.;王彦基于 TM 、 HJ-1B 和 MODIS 的北京城市 LST 检索。阿拉伯人。工程科学杂志 2016, 41, 2325-2332.[交叉引用]
刘 D.;刘晓波;王 H.;李英;康,Z.;曹 L.;于,X.;陈浩一种新型的雾霾?2015 年 12 月在中国南京举行的紫色(洋红色)雾霾活动。大气 2017, 8, 76。[交叉引用]
辛格,V.;卡内维尔,C.;芬齐,G.;皮索尼,E.;沃尔特,M.一种基于协同克里金的方法,用于重建空气污染地图、处理测量站浓度和确定性模型模拟。环境。型。软件。2011, 26, 778-786.[交叉引用]
郑 W.;刘晓波;倪,X.;尹, L.;Yang, B. 通过语义表示改进视觉推理。IEEE 访问版 2021, 9, 91476-91486。[交叉引用]
马,Z.;郑 W.;陈 X.;基于动态词向量的联合嵌入 VQA 模型。PeerJ 计算。科学 2021, 7, e353。[交叉引用]
郑 W.;刘晓波;Yin, L. 基于多层语义网络的句子表示方法.应用科学 2021, 11, 1316.[交叉引用]
唐 Y.;刘 S.;邓,Y.;张 Y.;尹, L.;郑伟一种改进的软组织建模方法。生物医学。信号进程。控制。2021, 65, 102367.[交叉引用]
姚 L.;卢,N.;江, S. 人工神经网络 (ANN) 用于使用地表、MODIS 和气象数据进行多源 PM2.5 估计。2012 年生物医学工程与生物技术国际会议论文集,中国澳门,2012 年 5 月 28-30 日;第 1228-1231 页。
吴 X.;刘 Z.;尹, L.;郑 W.;宋 L.;田 J.;杨 B.;刘 S.基于 LSTM 的成都雾霾预测模型。大气 2021, 12, 1479。[交叉引用]
尹, L.;王 L.;黄 W.;刘 S.;杨 B.;Zheng, W. 基于多重卷积模型的北京雾霾时空分析.大气 2021, 12, 1408。[交叉引用]
查克马,A.;维泽纳,B.;曹 T.;林 J.;Zhang, J. 使用深度卷积神经网络进行基于图像的空气质量分析。2017 年 IEEE 图像处理国际会议 (ICIP) 论文集,中国北京,2017 年 9 月 17-20 日;第 3949-3952 页。
张 Z.;王 L.;郑 W.;尹, L.;胡 R.;Yang, B. 基于金字塔 ORB 的内窥镜图像马赛克。生物医学。信号进程。控制。2022, 71, 103261.[交叉引用]
张 Z.;田 J.;黄 W.;尹, L.;郑 W.;刘 S.一种基于一维卷积神经网络的雾霾预测方法。大气 2021, 12, 1327。[交叉引用]
马,L.;王 F.基于 BP 神经网络和 matlab 的 haze 预测。2017 年计算机网络、电子和自动化国际会议 (ICCNEA) 会议记录,中国习安,2017 年 9 月 23 日至 25 日;第 210-220 页。
昌海,H.;帕克,I.;哦,H.-R.;吉姆,H.-J.;胡尔,S.-K.;金,J.;Choi, D.-R.使用递归神经网络算法为韩国首尔都会区开发 PM2.5 预测模型。环境。2021, 245, 118021.[交叉引用]
蔡英文;曾 Y.;Chang, Y. 使用 RNN 和 LSTM 进行空气污染预测。2018 年 IEEE 第 16 届可靠、自主和安全计算国际会议、第 16 届普适智能与计算国际会议、第 4 届大数据智能与计算国际会议以及网络科学与技术大会 (DASC/PiCom/DataCom/CyberSciTech),希腊雅典,2018 年 8 月 12 日至 15 日;第 1074-1079 页。
南杜里,A.;Sherry, L. 使用递归神经网络 (RNN) 对飞机数据进行异常检测。2016 年综合通信导航和监视 (ICNS) 会议记录,美国弗吉尼亚州赫恩登,2016 年 4 月 19 日至 21 日;第 5C2-1-5C2-8 页。
Scesa, V.;亨纳夫,P.;Ouezdou, F.B.;Namoun, F. 时间窗口宽度对动态 BPTT(h) 学习算法性能的影响:实验研究。在人工神经网络 - ICANN 2006 中;科利亚斯,SD,斯塔菲洛帕蒂斯,A.,杜赫,W.,奥贾,E.,编辑;施普林格:德国柏林/海德堡,2006 年;第 93-102 页。
帕斯卡努,R.;古尔塞尔,C.;赵,K.;本吉奥,Y.如何构建深度递归神经网络。arXiv 2013,arXiv:1312.6026。
班纳吉,I.;凌 Y.;陈,MC;哈桑, SA;朗洛茨,CP;Moradzadeh, N.;查普曼,B.;Amrhein, T.;蒙,D.;鲁宾,DL;等。卷积神经网络 (CNN) 和递归神经网络 (RNN) 架构在放射学文本报告分类中的比较效果。阿提夫。英特尔。医学 2019, 97, 79-88。[交叉引用][公共医学]
李英;郑 W.;刘晓波;牟 Y.;尹, L.;Yang, B. 基于 FAST 的特征检测算法的研究和改进。Rendiconti Lincei.科学与自然 2021, 32, 775-789.[交叉引用]
郑 W.;尹, L.;陈 X.;马,Z.;刘 S.;Yang, B. 视觉问答模型的知识库图嵌入模块设计。模式识别。2021, 120, 108153.[交叉引用]
郑 W.;刘晓波;基于改进多尺度关系网络的图像分类方法研究.PeerJ 计算。科学 2021, 7, e613。[交叉引用][公共医学]
泽巴里,D.Q.;阿卜杜拉齐兹,上午;阿卜杜勒曼,LM;哈桑,DA;卡里姆,O.S.基于深度递归神经网络的预测过程:综述。Asia J. Res. 计算。科学 2021, 11, 29-45.[交叉引用]
Rao, KS;德维,GL;Ramesh, N. 使用基于 lstm 的递归神经网络预测维沙卡帕特南的空气质量。国际 J. Intell.系统应用, 2019, 11, 18-24.[交叉引用]
吴 Z.;Zhang, S. 基于 GAM 的雾霾污染时空变化特征及影响因素研究.神经计算。应用 2019, 31, 1619-1631。[交叉引用]
张,L.;吴 Z.;Xu, J. 南半球极地涡旋对北方初冬中东部雾霾污染的潜在影响。Clim. Dyn.2020, 55, 771-787.[交叉引用]
尹,Z.;王 H.;Duan, M. 近年来中国实时季节性雾霾污染预测概述.2019, 42, 2-13.
刘 Y.;田 J.;郑 W.;基于空间统计的中国雾霾和污染颗粒物的时空分布特征.Urban Clim.2022, 41, 101031.[交叉引用]
徐 J.;刘 Z.;尹, L.;刘 Y.;田 J.;顾 Y.;郑 W.;杨 B.;Liu, S. 雾霾影响因子 PM2.5 的灰色相关性分析。大气 2021, 12, 1513。[交叉引用]
陈 X.;尹, L.;范 Y.;宋 L.;Ji, T.;刘 Y.;田 J.;Zheng, W. 基于连续小波变换的 PM2.5 浓度时间演变特征.Sci. Total Environ.2020, 699, 134244.[交叉引用]