闞光遠(yuǎn),洪 陽,梁 珂
(1. 清華大學(xué) 水利系,北京 100084;2. 中國水利水電科學(xué)研究院 北京中水科工程總公司,北京 100048; 3. 中國水利水電科學(xué)研究院 水利部防洪抗旱減災(zāi)工程技術(shù)研究中心,北京 100038)
機(jī)器學(xué)習(xí)基于仿生學(xué)發(fā)展而來,通過模擬人腦的功能解決實(shí)際問題。機(jī)器學(xué)習(xí)方法通常由一系列數(shù)值算式和數(shù)學(xué)變換組成,通過現(xiàn)代電子計(jì)算機(jī)及軟件程序?qū)崿F(xiàn)其功能。眾多機(jī)器學(xué)習(xí)方法中,人工神經(jīng)網(wǎng)絡(luò)(ANN)的關(guān)注度最高。近年來,隨著反向傳播訓(xùn)練算法的提出以及現(xiàn)代圖形處理器(GPU)引發(fā)的高性能計(jì)算革命的興起,ANN技術(shù)迎來了第二春。以深度學(xué)習(xí)、強(qiáng)化學(xué)習(xí)等技術(shù)為代表的現(xiàn)代ANN已成功應(yīng)用于多個(gè)領(lǐng)域,主要包括:計(jì)算機(jī)視覺、自然語言處理、文本識(shí)別、自動(dòng)駕駛汽車、人工智能甚至圍棋對(duì)弈等領(lǐng)域[1-3]。
許多學(xué)者嘗試將ANN技術(shù)應(yīng)用于洪水預(yù)報(bào)領(lǐng)域[4-7],取得了許多有益的成果。然而,由于洪水預(yù)報(bào)工作的高度復(fù)雜性,ANN的訓(xùn)練和測試精度仍不能同時(shí)達(dá)到滿意的效果。因此,提升ANN的預(yù)報(bào)能力和穩(wěn)定性需要進(jìn)一步研究。ANN性能尚不能令人滿意的主要原因如下:①傳統(tǒng)ANN模型通?;诋?dāng)前和前推若干時(shí)段的降雨和實(shí)測徑流量預(yù)測當(dāng)前時(shí)刻的徑流量,這種建模方式導(dǎo)致模型的預(yù)見期只有一個(gè)計(jì)算時(shí)段長,給徑流滾動(dòng)連續(xù)預(yù)報(bào)帶來了困難;②傳統(tǒng)ANN通常使用試算法來確定網(wǎng)絡(luò)拓?fù)浣Y(jié)構(gòu)(即隱含層神經(jīng)元個(gè)數(shù)),網(wǎng)絡(luò)拓?fù)浣Y(jié)構(gòu)確定后,再進(jìn)行參數(shù)的訓(xùn)練。這種兩步式訓(xùn)練方法不能同時(shí)優(yōu)化網(wǎng)絡(luò)拓?fù)浣Y(jié)構(gòu)和參數(shù),訓(xùn)練得到的網(wǎng)絡(luò)往往不是最優(yōu)結(jié)果。隱含層神經(jīng)元個(gè)數(shù)取得很大時(shí)雖然可以得到很好的訓(xùn)練精度,但進(jìn)行預(yù)報(bào)時(shí),網(wǎng)絡(luò)的泛化能力往往很差,預(yù)報(bào)精度衰減嚴(yán)重。減少隱含層神經(jīng)元個(gè)數(shù)雖然對(duì)提升網(wǎng)絡(luò)的泛化能力有益,但可能導(dǎo)致訓(xùn)練精度下降。因此,傳統(tǒng)的兩步式訓(xùn)練方法費(fèi)時(shí)費(fèi)力,面臨上述難題;③由于試算拓?fù)浣Y(jié)構(gòu)和基于梯度下降的反向傳播訓(xùn)練算法是局部優(yōu)化方法,傳統(tǒng)兩步式訓(xùn)練方法得到的網(wǎng)絡(luò)拓?fù)浣Y(jié)構(gòu)和參數(shù)往往不是全局最優(yōu)的,局部極小問題嚴(yán)重;④實(shí)際應(yīng)用中,單一的ANN往往不能取得滿意的效果,需要與其他機(jī)器學(xué)習(xí)方法相配合來提升精度。
為了解決ANN應(yīng)用中面臨的以上4個(gè)問題,本文提出了一種耦合機(jī)器學(xué)習(xí)模型,并用于流域洪水預(yù)報(bào)。該模型通過獨(dú)特的建模方式將ANN與K最近鄰方法相耦合,利用多目標(biāo)遺傳算法和Levenberg-Marquardt算法進(jìn)行全局最優(yōu)訓(xùn)練。在屯溪流域小時(shí)尺度洪水預(yù)報(bào)中的應(yīng)用表明,耦合機(jī)器學(xué)習(xí)模型的精度和可靠性較好,具有較好的應(yīng)用前景。
本研究基于屯溪流域。屯溪流域的自然地理特征介紹如下:屯溪流域位于我國東南沿海的安徽省皖南山區(qū),流域集水面積2 690 km2,是新安江水庫的重要入庫站。屯溪流域植被覆蓋良好,主要包括常綠針葉林、落葉闊葉林、混交林、林地、草地和牧草地等。土壤類型主要為黏壤土。流域位于亞熱帶季風(fēng)氣候區(qū),年平均溫度17 ℃,冬季干冷晴朗,盛行西北風(fēng);夏季高溫、濕度大、日照強(qiáng)烈,盛行東南風(fēng)。春秋兩季臺(tái)風(fēng)頻發(fā),冷熱交替頻繁,春夏兩季多發(fā)鋒面雨,夏秋兩季多發(fā)臺(tái)風(fēng)。季風(fēng)風(fēng)向與山嶺走向相垂直,山嶺阻擋臺(tái)風(fēng)和北方冷空氣的推進(jìn)。屯溪流域高程自西向東遞減,最大、最小和平均高程分別為1 398、116和380 m。
屯溪流域的降雨與產(chǎn)流特征介紹如下:流域年平均降水1 600 mm,降水年內(nèi)年際變化劇烈。50%洪水發(fā)生在4-6月間,20%洪水發(fā)生在7-9月間。徑流年內(nèi)年際變化劇烈。1996年6月30日,新安江流域發(fā)生新中國成立以來最大洪水,暴雨如注,河水驟漲,洪峰抵達(dá)中心城區(qū)適逢深夜,盡管水文部門做出了洪水預(yù)報(bào),但警報(bào)不及時(shí),洪魔肆虐,中心城區(qū)一片汪洋,屯溪老街商鋪淹沒水深2 m有余,沿河兩岸一片狼藉,損失慘重。在災(zāi)后反思中,黃山市政府下決定建設(shè)“黃山市洪水預(yù)報(bào)預(yù)警系統(tǒng)”,系統(tǒng)于1997年5月建成,成為當(dāng)時(shí)安徽唯一的集信息采集、數(shù)據(jù)處理、洪水預(yù)報(bào)為一體的綜合應(yīng)用系統(tǒng),在1998年、1999年、2001年和2006年洪水預(yù)報(bào)中發(fā)揮巨大作用。由此可見,洪水預(yù)報(bào)模型在防洪減災(zāi)中的作用是十分關(guān)鍵的。
屯溪流域雨量站、河網(wǎng)和DEM見圖1。屯溪流域小時(shí)尺度降雨徑流預(yù)報(bào)基于29場場次洪水,其中20場用于模型率定,其余9場用于模型檢驗(yàn)。場次洪水時(shí)間范圍從1982-2002年。流域具有11個(gè)雨量站,用于計(jì)算流域面平均雨量。
圖1 屯溪流域圖Fig.1 Map of the Tunxi watershed
流域出口徑流的模擬與預(yù)報(bào)基于多個(gè)預(yù)報(bào)因子,包括:降雨和前期徑流。降雨是產(chǎn)流的主要驅(qū)動(dòng)因子,包括當(dāng)前時(shí)刻降雨和前推若干時(shí)刻的降雨組成的序列。流域干濕狀態(tài)(主要由土壤濕度反應(yīng))是產(chǎn)流的另一個(gè)關(guān)鍵影響因子,由于數(shù)據(jù)驅(qū)動(dòng)模型無法計(jì)算土壤濕度,因此采用前期徑流來表征流域的干濕程度。前期徑流由前推若干時(shí)刻的徑流序列組成。以上預(yù)報(bào)因子作為模型輸入,驅(qū)動(dòng)模型進(jìn)行徑流預(yù)報(bào),具體建模方式見2.2小節(jié)。
降雨和前期徑流需要前推的時(shí)段數(shù)稱為模型的階數(shù)。階數(shù)對(duì)于模型預(yù)報(bào)精度和穩(wěn)定性十分重要,階數(shù)過小,模型能夠獲取的信息量有限,導(dǎo)致預(yù)報(bào)精度下降;階數(shù)過大,會(huì)引入冗余信息,導(dǎo)致率定期精度高而檢驗(yàn)期精度低的“過擬合”問題。本研究采用基于偏互信息的特征選擇算法辨識(shí)模型階數(shù),許多研究表明,該方法適用于非線性模型輸入變量選擇,具有精度高、冗余信息少的優(yōu)點(diǎn),是一種非常優(yōu)秀、成熟的輸入變量和階數(shù)識(shí)別算法[8-10],該算法的具體細(xì)節(jié)詳見相關(guān)參考文獻(xiàn)。階數(shù)識(shí)別的具體步驟為:
(1)確定降雨和前期徑流階數(shù)的上限?;趯?duì)流域歷史降雨-徑流資料特性的分析,估計(jì)出降雨形心至洪峰之間的滯后時(shí)段數(shù),階數(shù)上限取稍大于該滯后時(shí)段數(shù)的數(shù)值。
(2)根據(jù)2.2小節(jié)中的建模方式,將當(dāng)前時(shí)刻降雨、前推若干時(shí)刻降雨及前推若干時(shí)刻徑流作為候選輸入變量,前推時(shí)段數(shù)的最大值設(shè)置為階數(shù)的上限。
(3)將候選輸入變量作為輸入,對(duì)應(yīng)時(shí)刻的徑流量作為輸出,采用基于偏互信息的輸入變量篩選方法進(jìn)行迭代計(jì)算,求出候選輸入變量,即確定了階數(shù)。
耦合機(jī)器學(xué)習(xí)模型基于降雨序列和前期徑流序列實(shí)現(xiàn)流域出口徑流過程的預(yù)報(bào),其建模方式如下:
(2)
Q(t)=Qest(t)+Eest(t)
(3)
式中:Qest和Eest分別為徑流量和徑流量誤差的估計(jì)值;FANN和FKNN分別為基于ANN和K最近鄰(KNN)算法的徑流量和徑流量誤差估計(jì)方法;P和Qant分別為降雨和前期徑流;nP和nQ分別為降雨和前期徑流的階數(shù);Q為預(yù)報(bào)的徑流量。
徑流預(yù)報(bào)的流程為:首先,估計(jì)Qest;然后計(jì)算Eest;最后,將Qest和Eest相加求得預(yù)報(bào)徑流量。第一時(shí)段計(jì)算時(shí),前期徑流采用實(shí)測值,隨著計(jì)算時(shí)段的步步推進(jìn),將新求得的Qest值作為后續(xù)計(jì)算的前期徑流帶入以上公式,就實(shí)現(xiàn)了不需要實(shí)測前期徑流,而利用模型輸出的預(yù)報(bào)徑流量作為前期徑流的連續(xù)預(yù)報(bào)功能。由于這種建模方式利用了前期徑流的信息,且不需要前期徑流的實(shí)測值(而是用模型預(yù)報(bào)值代替),通過耦合ANN和KNN兩種算法,相互取長補(bǔ)短,實(shí)現(xiàn)了高精度連續(xù)預(yù)報(bào)[11-15]功能,有效延長了預(yù)見期,克服了傳統(tǒng)ANN模型只能提前一個(gè)計(jì)算時(shí)段進(jìn)行徑流預(yù)報(bào)的不足。
為了實(shí)現(xiàn)網(wǎng)絡(luò)拓?fù)浣Y(jié)構(gòu)和參數(shù)同時(shí)全局優(yōu)化的目的,利用一種能夠?qū)⒕W(wǎng)絡(luò)拓?fù)浣Y(jié)構(gòu)和參數(shù)同時(shí)編碼為一個(gè)實(shí)數(shù)序列的編碼方式[5],將實(shí)數(shù)序列作為多目標(biāo)非制約排序遺傳算法(NSGA-II)的決策變量進(jìn)行全局優(yōu)化,獲取網(wǎng)絡(luò)拓?fù)浣Y(jié)構(gòu)和初始參數(shù)。然后通過Levenberg-Marquardt反向傳播算法對(duì)網(wǎng)絡(luò)進(jìn)行進(jìn)一步精細(xì)訓(xùn)練,獲取最終的參數(shù)。多目標(biāo)遺傳算法的目標(biāo)函數(shù)采用預(yù)報(bào)精度和網(wǎng)絡(luò)復(fù)雜度兩個(gè)目標(biāo),可在訓(xùn)練精度和網(wǎng)絡(luò)復(fù)雜度間取得良好折中,在保證訓(xùn)練精度的前提下,有效提高了網(wǎng)絡(luò)的泛化和預(yù)報(bào)能力。在獲取的帕累托(Pareto)解集中選擇具有最佳預(yù)報(bào)精度的網(wǎng)絡(luò)結(jié)構(gòu)作為最優(yōu)網(wǎng)絡(luò)結(jié)構(gòu)。ANN訓(xùn)練完畢后,通過留一交叉驗(yàn)證方法對(duì)KNN算法參數(shù)(最近鄰個(gè)數(shù))進(jìn)行優(yōu)選。
實(shí)測和預(yù)報(bào)徑流散點(diǎn)圖見圖2。由圖2可知,率定和驗(yàn)證精度均令人滿意。率定期和驗(yàn)證期的回歸系數(shù)R2分別可達(dá)0.963 5和0.951 5。率定期散點(diǎn)圖中點(diǎn)據(jù)分布均勻。檢驗(yàn)期散點(diǎn)圖中點(diǎn)據(jù)分布較率定期稍差,點(diǎn)據(jù)分布較為離散,其R2值比率定期稍差。盡管檢驗(yàn)期結(jié)果比率定期稍差,耦合機(jī)器學(xué)習(xí)模型在檢驗(yàn)期的精度也是令人滿意的。率定期至檢驗(yàn)期精度衰減比率為0.951 5/0.963 5≈0.987 5,衰減程度較小,可以滿足洪水預(yù)報(bào)精度需求。由圖2(b)可以發(fā)現(xiàn),檢驗(yàn)期預(yù)報(bào)徑流與實(shí)測徑流相比,有所低估。
圖2 實(shí)測和預(yù)報(bào)徑流散點(diǎn)圖Fig.2 Scatter plots of observed and forecasted discharges
圖3中展示的是率定期和檢驗(yàn)期典型洪水場次模擬與實(shí)測過程線。通過觀察所有場次洪水預(yù)報(bào)過程線可知,耦合機(jī)器學(xué)習(xí)模型的預(yù)報(bào)精度較好,過程線比較光滑,取得了滿意的預(yù)報(bào)效果。良好預(yù)報(bào)效果得益于新型建模方式和新型模型更強(qiáng)的預(yù)報(bào)能力。經(jīng)過階數(shù)優(yōu)選的降雨輸入序列為模型提供了充足的水量信息,可以取得更好的水量平衡結(jié)果。光滑的過程線和良好的預(yù)報(bào)精度得益于前期徑流序列的貢獻(xiàn)。前期徑流序列確保了模型計(jì)算的連續(xù)性,提高了模型預(yù)報(bào)的穩(wěn)定性。
場次洪水誤差統(tǒng)計(jì)結(jié)果見表1。由表中結(jié)果可知,率定期和檢驗(yàn)期精度均令人滿意。實(shí)測洪峰范圍為633~6 490 m3/s。
圖3 率定期和檢驗(yàn)期徑流過程線圖Fig.3 Hydrographs of calibration and validation periods
洪號(hào)率定/檢驗(yàn)降雨/mm實(shí)測洪峰/(m3·s-1)徑流相對(duì)誤差/%洪峰相對(duì)誤差/%峰現(xiàn)時(shí)間誤差/h納什效率系數(shù)19820501081983051108198305142219830609061984082620198606110819870501081987061908198805070419880611011989050108198906120619890630231989072208199005010819900611081991051800199106300819920620001993052700率定512.04 280-0.08-0.70-10.9875.51 3001.813.2000.9679.91 510-6.948.3000.98119.42 170-0.38-8.7030.92172.72 5131.99-4.50-40.98511.62 260-3.10-8.2000.9474.26337.4159.60-10.52110.4945-22.36-21.10-60.79154.61 3903.689.5010.91191.91 000-10.59-8.2010.87312.91 740-12.42-7.0000.97197.92 274-3.887.4000.98161.61 740-4.65-6.9000.97132.01 4703.88-5.6020.9089.51 7007.65-18.4010.96355.52 500-7.379.70-30.94504.22 220-10.7019.7030.91355.12 060-4.58-30.3010.87357.53 150-10.780.7010.961 074.44 700-2.7918.3000.961994050100779.04 160-9.16-0.3010.9719950515001 010.94 070-7.97-13.7030.8919960601001 199.96 490-5.35-14.10-10.961997060600552.52 7303.81-3.5030.961999052108檢驗(yàn)208.42 9600.10-6.10-10.981999062215617.03 780-14.47-10.2000.92200105010898.11 41024.2418.1000.912001062008297.23 6407.090.5060.902002051308536.22 1205.890.4000.89
實(shí)測總降雨范圍為74.2~1 199.9 mm。率定期最大和最小洪峰為4 700 m3/s和633 m3/s。檢驗(yàn)期最大和最小洪峰為6 490 m3/s和1 410 m3/s。檢驗(yàn)期洪峰流量值范圍超越了率定期數(shù)據(jù)集,便于對(duì)模型泛化能力進(jìn)行進(jìn)一步的檢驗(yàn)。以下從徑流深相對(duì)誤差、洪峰相對(duì)誤差、峰現(xiàn)時(shí)間誤差和納須效率系數(shù)4個(gè)方面開展誤差分析。
3.3.1 徑流深相對(duì)誤差
率定期中,出現(xiàn)14個(gè)負(fù)誤差值和6個(gè)正誤差值,表明模型率定結(jié)果傾向于低估徑流深。檢驗(yàn)期中,出現(xiàn)4個(gè)負(fù)誤差值和5個(gè)正誤差值,表明檢驗(yàn)期并未顯著高估或低估徑流深。率定期中,僅有一場洪水(1987061908)的徑流深相對(duì)誤差的絕對(duì)值超過20%。檢驗(yàn)期中,僅有一場洪水(2001050108)的徑流深相對(duì)誤差的絕對(duì)值超過20%。以上結(jié)果表明,耦合機(jī)器學(xué)習(xí)模型的徑流深預(yù)報(bào)精度較好,檢驗(yàn)期精度更優(yōu),具有很好的泛化能力。
3.3.2 洪峰相對(duì)誤差
率定期洪峰相對(duì)誤差范圍為-30.3%~59.6%。有三場洪水的洪峰相對(duì)誤差絕對(duì)值超過20%,分別為1987050108、1987061908和1991063008。檢驗(yàn)期所有洪水的洪峰相對(duì)誤差絕對(duì)值均低于20%。率定期中,有11個(gè)負(fù)誤差值和9個(gè)正誤差值。檢驗(yàn)期中,有6個(gè)負(fù)誤差值和3個(gè)正誤差值。以上結(jié)果表明,率定期結(jié)果并未明顯高估或低估洪峰流量,但檢驗(yàn)期對(duì)洪峰流量有所低估。場次洪水1996060166的洪峰流量為率定期和檢驗(yàn)期的最大洪峰,耦合機(jī)器學(xué)習(xí)模型的預(yù)報(bào)精度很好,洪峰相對(duì)誤差小于20%。盡管該場洪水超過了率定期數(shù)據(jù)集的范圍,模型在率定期并未學(xué)習(xí)過如此大的洪峰流量,在檢驗(yàn)期仍取得了很好的預(yù)報(bào)結(jié)果,說明耦合機(jī)器學(xué)習(xí)模型具有很好的泛化能力。
3.3.3 峰現(xiàn)時(shí)間誤差
率定期和檢驗(yàn)期分別有兩場和一場洪水的峰現(xiàn)時(shí)間誤差超過了3 h??傮w來講,耦合機(jī)器學(xué)習(xí)模型的峰現(xiàn)時(shí)間誤差預(yù)報(bào)結(jié)果較好。率定期中有5個(gè)負(fù)誤差值和8個(gè)正誤差值。檢驗(yàn)期中有2個(gè)負(fù)誤差值和4個(gè)正誤差值。耦合機(jī)器學(xué)習(xí)模型預(yù)報(bào)的洪峰比實(shí)測洪峰總體上略有提前。
3.3.4 納什效率系數(shù)
從納什效率系數(shù)結(jié)果來看,耦合機(jī)器學(xué)習(xí)模型精度很好。大部分場次洪水的納什效率系數(shù)可達(dá)0.9以上。只有1987050108和1987061908兩場洪水的納什效率系數(shù)較低,分別為0.52和0.79。這兩場洪水屬于小量級(jí)洪水,洪峰流量分別為633 m3/s和945 m3/s。由于洪水量級(jí)較小,因此洪水非線性較強(qiáng)[16],導(dǎo)致模擬結(jié)果略差。
對(duì)所有29場洪水資料進(jìn)行了代表性與可靠性分析,具體介紹如下:
(1)率定期洪水。率定期洪水總降雨量與洪峰流量關(guān)系圖見圖4。由圖4可知,場次洪水總降雨量的范圍是74.2~1 074.4 mm,洪峰流量的范圍是633~4 700 m3/s。最小總降雨量對(duì)應(yīng)的場次洪水恰好具有最小洪峰流量,最大總降雨量對(duì)應(yīng)的場次洪水恰好具有最大洪峰流量。隨著洪峰流量由小變大,雖然存在幾場洪水的總降雨量有所波動(dòng),但總降雨量的變化趨勢總體上是增加的。這表明率定期洪水降雨-徑流資料的量級(jí)變化趨勢是合理、一致、可靠的。
圖4 率定期洪水分析Fig.4 Flood analysis of calibration period
(2)檢驗(yàn)期洪水。檢驗(yàn)期洪水總降雨量與洪峰流量關(guān)系圖見圖5。由圖5可知,場次洪水總降雨量的范圍是98.1~1 199.9 mm,洪峰流量的范圍是1 410~6 490 m3/s。最小總降雨量對(duì)應(yīng)的場次洪水恰好具有最小洪峰流量,最大總降雨量對(duì)應(yīng)的場次洪水恰好具有最大洪峰流量。隨著洪峰流量由小變大,雖然存在幾場洪水的總降雨量有所波動(dòng),但總降雨量的變化趨勢總體上是增加的。這表明檢驗(yàn)期洪水降雨-徑流資料的量級(jí)變化趨勢是合理、一致、可靠的。
圖5 檢驗(yàn)期洪水分析Fig.5 Flood analysis of validation period
(3)率定期和檢驗(yàn)期洪水代表性。率定期洪水總降雨量的范圍是74.2~1 074.4 mm,檢驗(yàn)期洪水總降雨量的范圍是98.1~1 199.9 mm,率定期和檢驗(yàn)期降雨量的量級(jí)和范圍基本一致,率定期和檢驗(yàn)期降雨資料的代表性和一致性較好。率定期洪水洪峰流量的范圍是633~4 700 m3/s,檢驗(yàn)期洪水洪峰流量的范圍是1 410~6 490 m3/s。檢驗(yàn)期洪水的洪峰流量大于率定期洪水的洪峰流量,這是為了考察模型對(duì)于率定期數(shù)據(jù)范圍外的洪水的預(yù)報(bào)能力,即考察模型的外推預(yù)報(bào)能力而進(jìn)行的設(shè)置。這種設(shè)置能夠考察預(yù)報(bào)模型對(duì)于未曾訓(xùn)練過的大洪水是否具有較好的預(yù)報(bào)能力,對(duì)于模型的實(shí)際應(yīng)用十分有益。
基于ANN和KNN算法,本文構(gòu)建了一種新型耦合機(jī)器學(xué)習(xí)模型,并用于洪水預(yù)報(bào)。該模型通過獨(dú)特的建模方式將ANN與KNN方法相耦合,利用多目標(biāo)遺傳算法和Levenberg-Marquardt算法進(jìn)行訓(xùn)練,較好地解決了傳統(tǒng)ANN模型預(yù)見期僅為一個(gè)計(jì)算時(shí)段長、ANN拓?fù)浣Y(jié)構(gòu)和參數(shù)難以同時(shí)優(yōu)化、ANN訓(xùn)練局部極小、單個(gè)ANN預(yù)報(bào)能力不佳等問題。在屯溪流域洪水預(yù)報(bào)中的應(yīng)用表明,耦合機(jī)器學(xué)習(xí)模型的精度和可靠性較好,具有較好的應(yīng)用前景。主要結(jié)論如下:
(1)耦合機(jī)器學(xué)習(xí)模型獨(dú)特的建模方式避免了使用實(shí)測前期徑流量數(shù)據(jù),轉(zhuǎn)而使用模擬前期徑流量進(jìn)行替代,在保證預(yù)報(bào)精度沒有明顯衰減的前提下有效增長了模型外推預(yù)報(bào)的時(shí)段數(shù),給延長數(shù)據(jù)驅(qū)動(dòng)模型預(yù)見期提供了新的手段,解決了傳統(tǒng)數(shù)據(jù)驅(qū)動(dòng)模型僅能進(jìn)行一個(gè)時(shí)段外推預(yù)報(bào)的問題。
(2)通過采用特殊的編碼方式將網(wǎng)絡(luò)結(jié)構(gòu)和參數(shù)編碼為一組決策變量,實(shí)現(xiàn)了同時(shí)優(yōu)化網(wǎng)絡(luò)結(jié)構(gòu)和參數(shù),與多目標(biāo)全局優(yōu)化算法的結(jié)合改善了網(wǎng)絡(luò)訓(xùn)練的局部極小問題。
(3)通過耦合ANN和KNN算法,進(jìn)行取長補(bǔ)短,有效提升了模型預(yù)報(bào)能力,對(duì)于訓(xùn)練期未接觸過的大洪水,在檢驗(yàn)期預(yù)報(bào)中仍能取得較為理想的預(yù)報(bào)精度。
(4)因模型結(jié)構(gòu)較為復(fù)雜,計(jì)算流程繁多,還存在計(jì)算量過大,訓(xùn)練速度較慢的不足,考慮未來采用并行計(jì)算技術(shù)進(jìn)行加速,是下一步研究的目標(biāo)。
□