Vol.17 No. 6 2019年12月
South-to-North Water Transfers and Water Science Technology
Dec. 2019
DOI : 10.13476/j. cnki. nsbdqk. 2019.0129殷兆凯,廖卫红,王若佳,等.基于长短时记忆神经网络(LSTM)的降雨径流模拟及预报[J].南水北调与水利科技,2019,17(6) :01-09,27. YIN Z K,LIAO W H,WANG R J,et al. Rainfall-runoff modelling and forecasting based on long short-term memory (LSTM)[J], South-to-North Water Transfers and Water Science Technology,2019,17(6) :01-09,27. (in Chinese)
基于长短时记忆神经网络(LSTM)的
降雨径流模拟及预报
殷兆凯1,廖卫红2,王若佳3,4,雷晓辉2
(1.天津大学水利工程仿真与安全国家重点实验室,天津300072;
2•中国水利水电科学研究院流域水循环模拟与调控国家重点实验室,北京100038;3.北京大学信息管理系,北京100871;4.北京大学海洋研究院,北京100871)
摘要:长短时记忆神经网络(LSTM)具有很强的时间序列关系拟合能力,非常适用于模拟及预报流域产汇流这一复 杂的时间序列过程。基于LSTM针对不同预见期的径流预报分别建立了流域降雨径流模型,以探讨LSTM在水文 预报当中的应用。模型采用流域降雨、气象及水文数据作为输人,不同预见期后的径流过程作为输出,率定期为
14 a,验证期为2 a。结果显示,在预见期为0〜2 d时LSTM预报精度很高,在预见期为3 d时预报精度较差,但仍
优于新安江模型。隐藏层神经元数量作为神经网络复杂程度的代表既会影响模型预报精度,也会影响模型训练速 度。而输入数据长度则仅会在预见期为0的条件下影响模型预报效果。关键词:降雨径流模拟;水文预报;机器学习;深度学习;长短时记忆中图分类号:TV12;P333
文献标志码:A
开放科学(资源服务)标识码(OSID):
Rainfall-runoff modelling and forecasting based on long short-term memory (LSTM)
YIN Zhaokai1,LIAO Weihong2,WANG Ruojia3,4, LEI Xiaohui2
(1. State Key Laboratory of Hydraulic Engineering Simulation and Safety ^Tianjin University 9 Tianjin 3000729China;2>. State Key Laboratory of Simulation and Regulation of Water Cycle in River Basin,China Institute of Water Resources and Hydropower Research,Beijing 10QQ38,China;3, Department of Information Management,Peking University 9Beijing 100871 ^China;i. Institute of Ocean Research ^Peking University,Beijing 100S71,China)
Abstract:The Long Short-Term Memory (LSTM) is suitable for rainfall-runoff modelling and forecasting since it has a strong ability in fitting time series. In this study,the LSTM was employed in predicting runoff in different foresight periods, in order to assess the capability of the LSTM in rainfall-runoff modelling and forecasting. The historical precipitation, meteorological and hydrological data were used as input data, runoff at after different foresight periods were selected as model output. The calibration period is 14 years and the validation period is 2 years. As expected, the proposed model shows a great ability to predict runoff 0-2 days ahead. With 3 days of foresight period, the LSTM performs relatively poor but still better than the Xinanjiang mcxlel. The number of hidden nodes has a primary impact on the prediction accuracy and training efficiency. While the length of input data has an impact on model performance only when the foresight period is 0 day.
收稿日期:2019~03~05 修回日期:2019~05-20 网络出版时间:2019-05-28网络出版地址:http://kns. cnki. net/kcms/detaU/13.1334. TV. 20190527.1535. 004. html
基金项目:“十三五”国家重点研发计划(2017YFB0203104);国家自然科学基金(51709273);广东省水利科技创新项目(2017-06)Funds:National Key Research &- Development Program of China (2017YFB0203104) ; National Natural Science Foundation of China
(51709273) ; Water Conservancy Science and Technology Innovation Project of Guangdong Province (2017-06)作者简介:殷兆凯(1991-),男,河北保定人,博士研究生,主要从事水文预报及模型研究。E-mail:yin2ha〇kai@tja edu. cn
通讯作者:廖卫红(1986-),女,湖北监利人,高级工程师,博士,主要从事水文预报及调度研究。E-mail: behellen@163 com
第17卷总第105期•南水北调与水利科技• 2019年12月
Key words:Rainfall-runoff modelling; Hydrological forecast;Machine learning;Deep learning;LSTM
i
研究背景
一直以来,水文预报领域的学者们都在尝试使
用参数化方法描述流域降雨径流过程的时空分布、 边界条件和物理过程,即传统意义上的水文模 型^。然而,水文模型发展到现在,一方面随着研 究的深人,时空离散愈发精细,时间上达到分钟级, 空间上达到米级;边界条件愈发多样,如水文气象、 地形高程、土地利用、植被类型、土壤类型、土壤含水 量等;物理机理愈发复杂,从地表到地下的分层产流 以及从坡面到河道的汇流过程均有相关研究。这样 高度发展的水文模型建立起来相当困难,所需的数 据(特别是下垫面条件)难以获取,计算效率也较 低[4]。另一方面,由于流域产汇流过程的高度复杂 性和不确定性等原因,水文模型复杂程度的提升并 不一定带来预报精度的显著提高,还会遇到异参同
效等问题ra;同时,水文模型由于本身机理的原因, 在仅依赖观测数据的前提下只能进行流域汇流时间 内的预报,想要延长预见期还需要气象预报数据作 为输入条件,这也会加大预报结果的不确定性。
随着信息技术的高速发展,流域水文气象资料 的观测取得了长足进步。与此同时,流域产汇流理 论却尚未取得重大突破。在这种背景下,一些学者 试图用数据驱动的方式来解决流域产汇流问题M。 人工神经网络(Artificial Neural Networks,ANN) 作为一种适用于拟合高度非线性系统的算法,早在 20世纪90年代初期就被应用于降雨径流模拟当 中[7]。递归神经网络(Recurrent Neural Networks,
RNN)作为人工神经网络的一种,由于其结构特别适 用于时间序列数据的关系模拟,也被应用在流域降雨 产流模拟的研究中Hochreiter和Schmidhuber® 针对RNN在学习较长时间序列时存在的梯度消失问 题进行改进,提出了长短时记忆神经网络(Long
Short-Term Memory,LSTM)。LSTM 以其在时间序 列模拟上的优势,被广泛应用于自然语言处理[1°]、医 药卫生[11]、经济金融[12]等各个领域。在水文学领域, 基于LSTM的研究则刚刚起步。Shi等™使用 LSTM进行了降雨临近预报研究。Fang等M将
LSTM应用于土壤含水量的预测当中。Zhang等 探讨了 LSTM在城市排水管道水位预报中的适用 性。在降雨径流模拟方面,Kratzen等[1«证实了一 个LSTM模型在单一流域和多流域上均有较高的
•
2
•
水丈水资进
预报能力。Hu等_比较了 LSTM与ANN在降雨 径流方面的能力,结果表明LSTM的预报精度高于
ANN。Tian等[18]将GR4J模型与多种不同的 RNN模型结合,提出了一种提高水文模型预报精度 的方法。Liang等™基于LSTM模型分析了三峡 水库运行与洞庭湖水位之间的关系。冯钧和潘 飞%则将LSTM模型与ANN模型结合起来,使用 多模型组合预报的方式进行场次洪水预报。
然而,上述研究针对LSTM模型的参数设置讨 论还不够深人,也没有涉及LSTM模型在延长预见 期方面的能力改进。本研究基于流域实测水文、气 象数据,针对不同的预见期建立LSTM模型,进行 径流预报,并将预报结果与新安江模型预报结果相 比较,分析了 LSTM模型参数对预报结果和模型训 练速度的影响。
2研究方法
长短时记忆神经网络(Long Short-Term Memory,
LSTM)作为一种特殊的递归神经网络(Recurrent Neural Network, RNN),与其它神经网络一样,由 输入层,一个或多个隐藏层,以及输出层组成。其隐 藏层中的神经元不仅能从输入层中接收信息,还可 以接收神经元从上一个时刻所感知的信息。这种 循环结构(图1(a))使得RNN能够学习到时间序 列数据的内在特征。然而,Bengio等™发现RNN 模型中存在梯度消失问题,该问题导致RNN很难 学习到较长周期的因果规律。为解决这一缺陷,
Hochreiter 和 Schmidhuber[9]提出用“记忆单兀” (memory block)替换RNN中的细胞单元(图1(b))〇 这一改变大大提升了神经网络的长时间记忆能力, 因此被命名为长短期记忆神经网络。
图1 RNN及LSTM神经网络的整体结构
Fig. 1 The structure of RNN and LSTM
殷兆凯,廖卫红,王若佳,等•基于长短时记忆神经网络(LSTM)的降雨径流模拟及预报
图2展示了一个LSTM记忆单元的典型结构。 在^时刻,记忆单元的输人包括前一时刻的隐藏层 状态变量、记忆单元状态变量和当前时刻 的输入信息;;然后模型依次通过遗忘门/,、输人 门L输出门〇,和这三个控制机制得到《时刻的隐 藏层状态变量A,和记忆单元状态变量c,;最终~会 传人输出层生成LSTM在(时刻的计算结果^,同 时与—起传人后一时刻进行计算。
记忆单元状态变量c,是LSTM保持长期记忆 的关键。由于其与其余LSTM单元状态之间为简 单的线性交互,因此可以在很长一段时间内保持信
息的不变,从而使得LSTM模型能够在训练网络时 防止梯度消失或爆炸问题。
然后,计算输出门0,。〇,可以决定在f时刻有多 少信息生成隐藏层状态变量、,其计算公式如下:
o,= (7) (8) 式中:1/。、讲。和6。为输出门的可调参数矩阵或向 量,在神经网络训练中这些矩阵或向量将被优化。 最终,/!,传入输出层,再经过计算后得到 LSTM在z时刻的最终输出乂。 yt=Wdh,+bd 神经网络训练中这些矩阵或向量将被优化。 图2 LSTM中记忆单元的内部结构 Fig. 2 The structure of one LSTM memory block (9) 式中和心为输出层的可调参数矩阵或向量,在 3 LSTM预报模型的建立 3. 1 LSTM超参数及目标函数确定 除了上面提到的可调参数外,在LSTM的建立 过程中还有一些超参数需要提前确定。这些超参数 将会决定LSTM的结构和训练等各个方面。其中, 隐藏层层数和隐藏层内神经元数量(》)将会决定 具体过程如下。 在f时刻的计算过程中,首先计算的是遗忘门 久 /,可以决定从之前的状态中舍弃多少信息[22]。 /,的计算公式如下: f= LSTM的结构。本研究中将隐藏层层数确定为1 层,隐藏层内神经元数量(《)作为LSTM复杂程度 的唯一代表将分别取值为2、4、8、16、32、64及128, 并在结果部分讨论《对预报结果的影响;在训练方 面,学习率设定为0. 0005,最大训练代数为500代。 模型优化算法方面使用自适应矩估计(adaptive moment estimation,ADAM)算法[23]。 式中:e为自然对数。 下一步,计算输人门k i,将决定从新获取的信 息中选择多少用以更新状态。6的计算公式如下: i,=ff(Lr,x(+W,/i ,_!+&,) 本研究选择和方差(SSE)作为LSTM优化过 程中的目标函数,计算公式如下: SSE=E(:^—5〇2 (10) (3) 式中:L7,.,W,和6,.为输入门的可调参数矩阵或向 量,在神经网络训练中这些矩阵或向量将被优化。 新获取信息的计算公式如下: c, = tanA(L/f x, + Wc- h -\\~bf) (4) 式中为第i时刻的实测值为第;时刻的预报 值;N为总时间步长数。3. 2 数据标准化 同其他神经网络一样,LSTM的输入数据也需 要进行标准化处理。本研究采用z-SC〇re[24]标准化 算法,计算公式如下: z= ^ (T (11) 式中:认,和卜为c'的可调参数矩阵或向量,在 神经网络训练中这些矩阵或向量将被优化;tan/i为 双曲正切激活函数: e1—e tanA(o:) = exjre (5) 接下来,使用上面计算得到的结果来更新神经 元状态,计算公式如下: +i,©ct (6) 式中^为标准化之后的数据;1为标准化之前的数 据^为数据的均值;<7为数据的标准差。 经过z-score标准化之后的数据均值为0,标准 水丈水资进 式中:©表示矩阵元素积。 • 3 • 第17卷总第105期•南水北调与水利科技• 2019年12月 差为1。本研究中训练集、测试集数据分别进行标 据的平均值。 准化,但计算所用的均值、标准差均来自训练集。模 NSE是一个标准化统计指标%,其值介于 型结果也使用训练集的均值、标准差来进行反标准 [一〜,1]之间,1表示模型结果完美拟合实测值。 化,进而与实测数据进行比较。BIAS可评估模拟结果总体水量平衡的精度,其取 3.3评价指标的选取 值范围为一100%到1〇〇%,最佳值为〇,取值为正说 为了量化LSTM在降雨径流模拟及预报中的精 明整体水量偏高,负则意味着整体水量偏低。RMSE 度,本研究使用了三种量化指标,分别为NasbSut- 用来衡量模拟值同真实值之间的偏差,取值范围在 cliffe效率系数(NSE)或确定性系数、相对偏差(BI- [0,+〇〇]之间,取值为0时说明模型拟合效果最好。AS)和均方根误差(RMSE)。具体计算公式如下: 4 研究区及数据介绍 2(乂一;,+ )2 NSE=1- ^-----— (12)4.1 研究区概况 1 = 1 本研究选取锦江流域高安站以上部分作为研究 SG,—x) 区域。锦江流域位于赣江流域的西北部,总流域面积 BIAS=i:=H^--------X100% (13) 为6 215 km2 (图3),代表站为高安水文站。锦江流域 地势西北高,东南低,海拔高度为18〜1 096 m。锦江 /eg,—3/,)2 流域位于亚热带地区,气候温暖湿润,雨量充沛,年降 (14) 水量约为1 300〜2 100 _。髙安站年均径流量约 式中:i为第〗个时刻;N为总时间步长数G表示模 为184 m3/s。作为赣江第二大支流,锦江在南昌市 拟数据W表示真实的径流观测数据G表示观测数 以南约30 km处汇人赣江干流。 28°45VN_ 28°30,ff,N- 28015,(TN. 28°(y(rN. ----锦江 ■宜春 國高安舰 113045,(TE 114c(y(TE 114°15,(TE 11403(y(rE 114°45,(TE 115°(y(TE 115°15,(TE 115°30,CrE 图3赣江流域高安站以上流域 Fig. 3 Map of the Jinjiang River Basin 4. 2 数据介绍 中的能力,本研究分别针对不同预见期下(〇〜3 d) 本研究采用了锦江高安站以上流域20个雨量 高安水文站径流量(假定当前日为£山表示为Q、 站的逐日降水资料,流域周边宜春、樟树2个气象站 (^+^兑+:和兑+^建立LSTM预报模型。每个模 逐日最高温、最低温、平均气温、平均风速、相对湿 型的输出即为对应预见期后的高安站径流量,是一 度、日照时长等气象资料,以及高安站逐日平均径流 个标量。模型输人为id及之前数日的历史气象、 量资料。数据长度为2000 — 2015年。其中2000 — 水文和时间数据,包括20站降雨数据、宜春及樟树 2013年为训练期,2014—2015年为验证期。站6种气象数据,高安站实测径流数据,以及当前数 4.3模型输入输出确定 据所在月份,共34项。输人数据长度(s叫)作为本 为了验证LSTM在流域降雨径流模拟及预报 研究的讨论内容之一,取值范围为[2,7]。将这些数 —bm— a— a—«—a»—s— bmmb • 4 • 水文未资淥 殷兆凯,廖卫红,王若佳,等•基于长短时记忆神经网络(LSTM)的降雨径流模拟及预报 据构建成一个34 X网维度的矩阵,输人LSTM模 型进行计算。需要指出的是,在预报fd径流时,作 为模型输人的id实测径流取值为0。另外,如果 0〜3 d的径流预报。新安江模型使用与LSTM模型 相同的数据作为模型输入及相同的训练期。但在预 报未来径流(预见期U+1)〜(H*3) d)时,均假定未 来降雨量为〇,未来气象数据为多年平均值。 表1 不同预见期径流预报结果统计 different foresight periods Tab. 1 Statistical metrics of prediction accuracy for LSTM的模型输出为负值,则会被调整为0。 5预报精度评价及分析 整体预报效果评价 使用LSTM神经网络预报高安站径流量的预 预报目标 5. 1 评价指标 NSE 最优值 0. 91670. 049459. 7118 seq 444 n 1288128 报结果统计指标见表1。从中可以看出,在不同预 见期下LSTM预报整体效果较好。在所有的预见 期下BIAS指标均小于0. 5%,说明LSTM预报结 果在整体水量平衡方面精确度很高。在预报id径 流量时预报效果最好,NSE值达到最高,为(L 9167, a BIAS/% RMSE/(m3 • s-1) NSE Qt+i BIAS/% RMSE/(m3 • s-1)NSE 0. 90220. 206064. 7309 767 424 RMSE值达到最低,为59. 7118 m3/s。随着预见期 的增长,预报精度随之下降。在预报U+l) d、U+2) 0. 87280. 218673. 8337 646 41284 d径流时精度下降幅度较小,但在预报U+3) d径 流时预报精度下降明显,NSE仅为0. 6363,RMSE 仅为124 7761 m3/s。在模型最优参数方面,在不 同的预见期下,最优的NSE值和RMSE值都在相 同的参数取值下得到,但最优BIAS值均在与之不 同的参数下得到。 为了进行比较,用新安江模型在高安流域建模, 在验证期内的两个时间段上进行了预见期同样为 1750 •实测值 Qt+2 BIAS/% RMSE/(m3 • s-1)NSE 0. 6363-0. 1441124. 7761 343 2162 Or+3 BIAS/% RMSE/(m3 • s1) 第一段为2014年汛期的一部分,时间从2014 年6月14日至2014年8月4日,见图4。图中(a)、 (b)、(c)和(d)分别代表两种模型在预见期为0〜3 d 1750 r •实测值 1 500 -( >€日)/_镔® 2.50(7 552 01^ —LSTM ----新妾江 OQOQO 10( 2014-Q7-W 2014-07-14 2014-07-24 2014-08-002014-06-14 2014-06-■ 2014-06-14 2014-06-^ 2014-07-W 2314-07-14 2014-07-24 2014-08-03 C时间 U)预见期〇d 时间 (b)预见期Id 1750 实测值 1 0» 0 ^ 2 5)0 ( LSTM ---新安江 d T«.v)/¥«® K)(0 5 0 0( )07 5 D14-06-14 2014-OS-^ 2014-07-W 2014-07-14 2014^07-24 2014^8-03 0 -------------•------1------'------■-时间 (c)预见期2d 2014^07-M 2014-07-14 2014-07-24 2014-08-03 时间 (d)预见期3d 图4 LSTM与新安江模型在汛期预报效果比较(2014年汛期1 Fig. 4 Result comparison of the LSTM and the Xinanjiang model in the flood season of 2014 第17卷总第105期•南水北调与水利科技• 2019年12月 时的预报结果。从图4中可以看出,在预见期为 2015年9月29日至2015年11月29日,见图5。 0〜2 d时LSTM模型可以较好地反映汛期的洪水 图中(a)、(b)、(c)和(d)分别代表预见期为0〜3 d。 过程,但预见期为3 d时则不能较好地模拟预报洪 从图中可以看出,在非汛期LSTM仍可以较好地反 水过程。新安江模型在预见期为〇 d的情况下预报 映整体的径流过程,特别是基流过程。在预见期为 能力与LSTM模型相当,但在第二个洪峰处出现低 0〜1 d时,新安江模型对于洪峰过程的预报能力较 估的现象。随着预见期的延长,由于未来降水输入 好,与LSTM模型相当。当预见期延长到2〜3d 被设定为〇,新安江模型的洪峰预报能力退化明显, 时,LSTM在非汛期的预报能力退化不明显,但新 低估洪峰的能力愈发严重,在预见期为3 d时几乎 安江模型的预报能力,特别是洪水过程预报能力则 不能预报出洪峰过程。 有明显的下降,会明显倾向于低估洪水过程。另外, 第二段为2015年非汛期的一部分,时间从 在所有预见期下,新安江模型都会低估河道基流。 750-1 750n ------•LSTM 实测值 ----新安江 —,____________,_____2015-(»-29 2015-10-13 2015-10-27 2015-11-10 2015-11-242015-0&-29 0- 2015-10-13 2015-10-27 2015-11-10 2015-11-24 (a)预日分见间 期〇d (b )预时间 见期1 d 75〇i 750-1 7 /日 )/_锯S 〇 ~_____ -----r-- J_______,__ Q f j ~ ~ ~ ---------: { 2015-09-29 2015-10-13 2015-10-27 2015-11-10 2015-11-^ 2015-09-29 2015-10-13 2015-10-27 2015-11-10 2015-11-24 (c)预时间见 期2d (d)预时见间期3d 图5 LSTM与新安江模型在汛期预报效果比较(2015年非汛期) Fig. 5 Result comparison of the LSTM and the Xinanjiang model in the dry season of 2015 5.2预报结果受模型参数影响分析 相对预报效果相对较好。^9值对于预报精度的影 为分析LSTM模型预报精度在模型参数影响 响则相对较小。 下的变化趋势,本研究选取了 2个参数进行研究,一 造成这种结果的原因可能为,越复杂的LSTM 个为神经网络seg,代表输入信息的多少;另一个为 神经网络拟合程度越强,越能学习模型输入输出之 神经网络隐藏层中的神经元个数(n),代表神经网络 间的相关性。在预见期为〇时dd的径流量与当日 的复杂程度。图6以NSE为指标,对LSTM模型 及之前的气象、水文数据关系更紧密,因此学习能力 在不同预见期下预报效果受上述两种参数的影响进 越强的模型越能精确地进行模拟。而在预见期大于 行了比较。图中(a)、(b)、(c)和(d)分别代表预见期 〇时,河道径流与历史水文、气象数据之间的相关性 为0〜3d。从中可以看出,在预报当前Gd)的径流 则相对较小,径流不确定性增强。且预见期越长,相 量时(图6(a) ) 和取值较大的时候LSTM会 关性越小,不确定性越强。这种情况下神经网络拟 取得较高的预报精度,其中seg值为4〜6,?v值为 合能力越强,反而越会造成过拟合的现象,过分地追 32〜128的时候效果最好。在预报未来Q+l、f+2 求训练集上的预报精度而丧失了通用性,导致在测 和H~3)径流量时(图6(b)至图6(d)),w值较小时, 试集上预报精度的下降。 水文水资诛 殷兆凯,廖卫红,王若佳,等•基于长短时记忆神经网络(LSTM)的降雨径流模拟及预报 NSE —116 ■- -5 4 -------------「 3 2 4 8 16 32 64 1282 4 8 16 32 64 128 神经元数量n (a)预见期Od 神经元数量<7 (b)预见期Id NSE 6 crs« 5 ^ s:ttr-<锯 sfrY 4 ® crsfes^ 6-5- 3 8 16 32 64 1282 4 8 16 32 64 128 神经元数量n (C )预见期2 d神经元数量n (d)预见期3d 图6模型参数对LSTM预报精度的影响 Fig. 6 Model performance? influenced by model parameters 5.3模型优化速度受模型参数影响的趋势 图7描述了在不同预见期及在不同神经元数量 («)设置下,LSTM模型训练过程中目标函数值随 迭代次数而变化的情况(前100代)。图中(a)、(b)、 (c)和(d)分别代表预见期为0〜3 d,网均为该预见 期条件下的最优值(以NSE值为指标,见表1)。从 图7中可以发现,在不同的预见期下,LSTM模型 的进化迭代速度均随神经元数量(《)的增大而加快。 若》为2,则目标函数值在迭代20次以后下降速度 放缓;若《为128,则目标函数值在10代以内就可 以达到稳定。 这种结果同样可以用不同复杂程度神经网络拟 合能力的不同来解释。》值越大,神经网络越复杂, 拟合能力越强,因此进化到能够拟合复杂降雨径流 关系的状态所需要的次数就越少。但需要注意的 是,训练过程中目标函数值的计算是在训练集上进 行的,因此目标函数值不能代表LSTM模型在测试 集上的拟合能力。 图8则描述了在不同预见期及不同s叫设置 下,LSTM模型训练过程中目标函数值随迭代次数 而变化的情况(前1〇〇代)。图中(a)、(b)、(c)和(d) 分别代表预见期为〇〜3 d,神经元数量U)均为该 预见期条件下的最优值(以NSE值为指标,见表 1)。从图8中可以发现,在不同的预见期下,LSTM 模型的进化迭代速度均不随seg的变化而变化。 6结论 本研究基于LSTM在锦江流域进行了不同预 见期的日尺度降雨径流模拟和预报,并得到以下结论。 (1) 在径流预报精度方面,LSTM在预见期为 0〜2 d时预报精度较高,在预见期为3 d时预报精 度较差。与新安江模型相比,在相同的预见期下, LSTM均能展现比新安江模型更好的预报性能。 (2) 在模型参数对预报精度的影响方面,预报当 曰径流时,输人数据长度越长且神经元数量越多,预 报精度越高;而在预报未来径流时,神经元数量越 少,预报精度越高。 (3) 在模型参数对模型训练速度的影响方面,神 经元数量会显著影响模型训练速度,神经元数量越 多,模型收敛速度越快;输入数据的长度则对训练速 度没有显著影响。 水文水资进 第17卷总第105期•南水北调与水利科技• 2019年12月 图7 n对LSTM训练速度的影响 Fig. 7 Different loss function values decrease speed influenced by n values 图8 seg对LSTM训练速度的影响 Fig. 8 Different loss function values decrease speed influenced by seq values • 8 • 水文水资逯 殷兆凯,廖卫红,王若佳,等•基于长短时记忆神经网络(LSTM)的降雨径流模拟及预报 LSTM的引人是数据驱动方法在降雨径流模 拟及预报领域应用的新尝试。然而,本研究仍存在 —定不足。比如在LSTM模型学习率、最大训练代 数等超参数的选取上依旧依赖经验,隐藏层的层数 也仅选取了1层。今后将对这些方面的规律进行研 究,以期进一步提高模型的稳定性和适用性。 参考文献(References}: LSTM-CNN model with attention for aspect-level text classification!]J]. Future Internet,2018,10(12): 116. DOI: 10. 3390/fil0120116. [11] 李雪.基于LSTM的心律失常分类研究[D].兰州:兰 州大学,2018. (LI X* Research of Arrhythmia Classification Based on I^TM[D], Lanzhou: Lanzhou University,2018. (in Chinese)) [12] FISCHER T, KRAUSS C. Deep learning with long short-term memory networks for financial market predictions [ J ]. European Journal of Operational Research, 2018, 270(2): 654-669. DOI: 10. 1016/j. ejor. 2017. 11.054. [13] SHI X,CHEN Z,WANG H,et al. Convolutional LSTM network: A machine learning approach for precipitation nowcasting [C]// Advances in neural information processing systems. 2015: 802-810. [14] FANG K,SHEN C,KIFER D,et aL Prolongation of SMAP to spatiotemporally seamless coverage of continental US using a deep learning neural network [J], Geophysical Research Letters, 2017,44 (21) : 11, 030-11,039. DOI: 10. 1002/2017gl075619.[15] ZHANG D, LINDHOLM G, RATNAWEERA R Use long short-term memory to enhance Internet of Things for combined sewer overflow monitoring [J], Journal of Hydrology, 2018, 556: 409-418. CX3I: 10. 1016/j. jhydroL 2017.11. 018. [16] KRATZERT F,KHJIZ D,®E^NER C,et aL RainfaU-ruriDff modelling using long short-term memory (LSTM) networks [J]. Hydrology and Earth System Science, 2010,22:6005-6022. DOI: 10. 5194/hess-22-6005-2018. [17] HU C,WU Q,LI H,et al. Deep learning with a long short-term memory networks approach for rainfall-runoff simulation [J]. Water, 2018, 10 ( 11): 1543. DOI: 10. 3390/wl0111543. [18] TIAN Y,XU Y P,YANG Z, et al. Integration of a parsimonious hydrological model with recurrent neural networks for improved streamflow forecasting [J]. Water,2018,10(11):1655. DOI:10. 3390/wl0111655. [19] LIANG C,LI H,LEI M, et al. Dongting Lake water level forecast and its relationship with the Three Gorges Efem Based on a long short-term memory network DJ Water,2018,10(10) : 1389. DOI: 10. 3390/wl0101389. [20] 冯钧,潘飞•一种LSTM-BP多模型组合水文预报方 法[J]•计算机与现代化,2018 (7):82-85,92. (FENG [1] FKEIZE R A’HARLAN R L Husprint for a physical^based, digitally-simulated hydrologic response model [ J ]. Journal of Hydrology, 1969, 9 (3) : 237-258. DOI: 10. 1016/0022-1694(69)90020-1.[2] KIRCHNER J W. Getting the right answers for the right reasons: Linking measurements,analyses, and models to advance the science of hydrology[J]. Water Resources Research,2006,42,W03S04. DOI: 10. 1029/ 2005WR004362.[3] 芮孝芳.论流域水文模型[J].水利水电科技进展, 2017,37(4): 1-7. (RUI X F. Discussion of watershed hydrological model [ J ]. Advances in Science and Technology of Water Resources, 2017,37(4); 1-7. (in Oiinese)) DOI: 10. 3880/j. issa 1006-7647. 2017.04. 001.[4] WOOD E F, ROUNDY J K, TROY T J, et al. Hyperresolution global land surface modeling: Meeting a grand challenge for monitoring Eartk s terrestrial water [J]. Water Resources Research, 2011, 47, W05301. DOI: 10.1029/2010WR010090. [5] YIN Z,LIAO W,LEI X,et aL Comparing the hydrological responses of conceptual and process-based models with varying rain gauge density and distribution [ J ]. Sustainability, 2018, 10 (9): 3209. EX3I: 10. 3390/ sul0093209. [6] 芮孝芳.水文学与“大数据”[J].水利水电科技进展, 2016,36(3): 1-4. (RUI X F. Hydrology and big data [J]. Advances in Science and Technology of Water Resources,2016, 36(3): 1-4. (in Chinese)) DOI: 10. 3880/j. issa 1006-7647. 2016. 03. 001. [7] HALFF A H, HALFF H M, AZMOODEH M Predicting runoff from rainfall using neural networks [ C]//. 760-765.Engineering hydrology. ASCE, 1993: [8] LIN H K,GUPTA H V,SOROOSHIAN Si Application of a recurrent neural network to rainfall-runoff modeling[C]//Proceedings of the 1997 24th Annual Water Resources Planning and Management Conference. ASCE, 1997: 68-73.[9] HOCHREITER S, SCHMIDHUBER J. Long short-term memoryCJ]. Neural computation, 1997»9(8): 1735-1780. DOI: 10.1162/neca 1997. 9. 8.1735. [10] ZHU Y,GAO X,ZHANG W,et al. A bi-directional J, PAN F. A hydrologic forecast method based on I^STM-BP[J]. Computer and Modernization,2018 (7) : 82-85* 92. (in Chinese)) EX3I: 10. 3969/j. issn. 1006-2475. 2018. 07. 017. (下转第27页) 水文水资錄 • 9 • 王生春,魏加华,万佳华,等•基于SMOS数据的三江源土壤水分时空变化 Journal of Hydrology, 2000, 228 (1) : 113-129. EX3I: 10. 1016/S0022-1694(00)00144-X. [19] 张宇镭,党琰,贺平安.利用Pearson相关系数定量分 析生物亲缘关系[J].计算机工程与应用,2005(33): impact factors in the Three-River Headwater Region from 2000 to 2013 [J]. Geo-Information Science, 2016,18(12): 1707-1716. (in Chinese)) DOI: 10. 3724/SP. J. 1047. 2016. 01707. [23] 耿晓平,铁吉新.三江源区植被覆盖变化的气候效应 初探[J]•青海气象,2018(2): 30-35 (GENG X P,TIE 83-86,103. (ZHANG Y L,DANG Y,HE P A Quantitative analysis of the relationship of biology species using pearson correlation coefficient [J]. Computer engineering and Applications, 2005 (33) : 83-86, 103. (in Chinese)) DOI:10. 3321/j. issn: 1002-8331. 2005. 33. 026.[20] AL-YAARI A, WIGNERON J P, KERR Y, et al. Evaluating soil moisture retrievals from ESA”s SMOS and NASA^s SMAP brightness temperature datasets [J], Remote Sensing of Environment, 2017,193: 257- 273. DOI:10. 1016/j. rse. 2017. 03. 010.[21] SUN Q L, LI B L, ZHOU C H, et al. A systematic review of research studies on the estimation of net productivity in the Three-River Headwater Region, China[J]. Journal of Geographical Sciences,2017,27 (2): 161-182. DOI:10. 1007/sll442-017-1370-z. [22] 孙庆龄,李宝林,许丽丽,等.2000-2013年三江源植被 NDVI变化趋势及影响因素分析[J].地球信息科学 学报,2016,18(12): 1707-1716. (SUN Q L,LI B L, J X. Preliminary study on climate effect of vegetation cover change in the Three-River Headwater Region 30-35. (in [J]. Qinghai meteorological, 2018 (2):Chinese)) [24] 向怡衡,张明敏,张兰慧,等.祁连山区不同植被类型 上的SMOS遥感土壤水分产品质量评估[J].遥感技 术与应用,2017, 32 (5): 835-843. (XIANG H Y, ZHANG M M, ZHANG L H, et al. Validation of SMOS soil moisture product on different vegetation types in Qilian MountainCJ]. Remote Sensing Technology and Application,2017,32(5) : 835-843. (in Chinese)) DOI: 10. 11873/j. isssa 1004-0323. 2017. 5. 0835.[25] ZHUO L,DAI Q,HAN D. Evaluation of SMOS soil moisture retrievals over the central United States for hydro-meteorological application [ J ]• Physics and Chemistry of the Earth, Parts A/B/C, 2015, 83-84: 146-155. DOI: 10. 10016/j. pee. 2015. 06. 002. XU L L,et al. Analysis of NDVI change trend and its (上接第9页) [21] BENGIO Y, SIMARD P, FRASCONI P. Learning long-term dependencies with gradient descent is difficult[J]. IEEE transactions on neural networks, 1994,5(2): 157-166. DOI: 10. 1109/72. 279181. [22] GERS F A,SCHMIDHUBER J,CUMMINS F. Learning to forget : continual prediction with LSTM[J]. Neural computation,2000,12(10) : 2451-2471. DOI: 10. 1162/089976600300015015. [23] KINGMA D P,BA J. Adam: A method for stochastic [24] optimization [EB/OL]. https : //arxiv. org/abs/ 1412. 6980,2014-12-22/2019-05-16 ZILL D, WRIGHT W S, CULLEN M R Advancedengineering mathematics [ M]. Jones &• Bartlett Learning, 2011. [25] NASH J E, SUTCLIFFE J V. River flow forecasting through conceptual models part I: A discussion of principles[J]. Journal of hydrology, 1970, 10 (3): 282-290. 水文水资源27 • 因篇幅问题不能全部显示,请点此查看更多更全内容