• 
    

    
    

      99热精品在线国产_美女午夜性视频免费_国产精品国产高清国产av_av欧美777_自拍偷自拍亚洲精品老妇_亚洲熟女精品中文字幕_www日本黄色视频网_国产精品野战在线观看

      ?

      基于遙相關的三峽水庫中長期徑流預測

      2016-03-15 05:58:24董前進張旭
      關鍵詞:三峽水庫環(huán)流徑流

      董前進, 張旭

      (1.武漢大學 水資源與水電工程科學國家重點實驗室,湖北 武漢 430072; 2.江西師范大學 鄱陽湖濕地與流域研究教育部重點實驗室,江西 南昌 330022; 3.武漢大學 湖北省水資源安全協(xié)同創(chuàng)新中心,湖北 武漢 430072)

      基于遙相關的三峽水庫中長期徑流預測

      董前進1,2,3, 張旭1

      (1.武漢大學 水資源與水電工程科學國家重點實驗室,湖北 武漢 430072; 2.江西師范大學 鄱陽湖濕地與流域研究教育部重點實驗室,江西 南昌 330022; 3.武漢大學 湖北省水資源安全協(xié)同創(chuàng)新中心,湖北 武漢 430072)

      徑流中長期預測是水利水電工程設計、施工和運行管理的重要依據,而預報因子的選取和預報模型的構建一直是徑流中長期預測的兩大難點。本文以宜昌站1951—2013年汛期流量資料為例,根據國家氣候中心74項環(huán)流特征量,分別構建了基于相關系數法和隨機森林算法的徑流預測遙相關模型,并且對比了依據不同的相關系數和因子選擇數目對預測精度的影響。結果表明,相較于傳統(tǒng)的相關系數法,基于隨機森林算法的預測模型的穩(wěn)健性與預測精度均可大大提高。研究內容可為三峽水庫中長期徑流預報及中長期調度計劃制定提供技術支撐。

      中長期徑流預測;遙相關;隨機森林算法;多元線性模型;宜昌站

      隨著當前社會經濟的高速發(fā)展,人們對水文預報的要求越來越高,不僅要求有準確的短期預報以防御突發(fā)的暴雨洪水事件,同時要求有較長預見期的中長期水文預報以擬定相關規(guī)劃與計劃[1]。中長期水文預報主要利用大氣因子或者海溫因子進行徑流預測,分為因子篩選和模型建立兩部分。待選因子通常包含74項大氣環(huán)流指數和海溫因子等。因子篩選主要有相關系數法、逐步回歸法和全子集回歸法等[2],但這些方法只考慮到了單個因子同預測目標間的相關關系,以此構建的模型往往不是最佳模型,且根據相關系數選擇多少預測因子較為合適尚存在疑問,較易因為因子選擇過多而造成過擬合[3]。模型的建立是近些年研究的重點內容,常見的模型主要包含神經網絡模型[4]、時間序列模型[5]、支持向量機模型[6]、基于小波分析的預測模型[7]等??傮w而言,在因子的篩選方法上一直研究較少。隨機森林(Random Forest,RF)算法作為近些年來興起的新型智能算法,具有較好的預測能力和相對簡易的編碼,在特征因子的選擇方面具有獨特的優(yōu)勢。該算法不僅能考慮單個因子的重要性,而且可考慮因子之間的復雜聯(lián)系。文獻[8]將隨機森林算法作為因子選擇的工具,把篩選過的因子作為神經網絡模型的輸入層,取得了較好的效果;文獻[9]則利用隨機森林算法進行因子的篩選和洪水風險分析,并且將結果與隨機向量機模型進行對比;同時,隨機森林模型也成功地運用于長江中上游枯水期徑流預測中[10]。因此,本文將嘗試基于隨機森林算法進行三峽水庫宜昌站汛期徑流的中長期預測。

      三峽水庫是當今世界最大的水利樞紐工程,具有防洪、發(fā)電、航運、生態(tài)等綜合功能。每年6—9月為汛期,10月至次年5月為非汛期。目前三峽水庫短期預報已經取得了令人滿意的成果,而中長期預報還處于發(fā)展階段[11]。三峽水庫的中長期徑流預報不僅有利于制定更科學合理的調度計劃,更有利于三峽水庫水資源的綜合調度,協(xié)調各部門對水資源的需求,充分發(fā)揮三峽水庫的綜合效益等。當前三峽水庫中長期徑流預測的方法中,有利用混沌神經網絡模型進行預測的[12],還有在多元線性回歸模型、自回歸模型、最近鄰抽樣回歸模型以及支持向量機模型上引入小波分析,實現(xiàn)了較為精確的中長期徑流預報的[12],但都缺少對預測因子選擇的研究和針對汛期徑流的中長期預測。

      許多觀測事實表明,全球各個區(qū)域環(huán)流的變化與異常是有相關性的。一個區(qū)域環(huán)流的變化與異??梢砸鹆硪恍﹨^(qū)域環(huán)流的變化與異常,這種區(qū)域性環(huán)流變化與異常的相關性稱為大氣環(huán)流遙相關[13]。當前已有研究表明,三峽水庫徑流同大氣因子具有較強的相關關系[14-15],即遙相關。本文正是基于遙相關考慮三峽水庫徑流的中長期預測。根據國家氣候中心提供的74項環(huán)流特征指數,針對三峽水庫1951—2013年的汛期洪峰、洪量分別構建了基于相關系數法和隨機森林算法的徑流預測模型,比較了不同的預測因子選擇方法和選擇數目的影響,找出了最佳的預測因子初篩方法和最合適的因子篩選數目。

      1 基于相關系數法的徑流預測

      首先構建了基于相關系數法的宜昌站汛期徑流預測模型。通常選用過去兩年1—12月份和當年1—5月份的74項大氣環(huán)流指數、一階平均和二階平均后過去兩年1—12月份和當年1—5月份的74項大氣環(huán)流指數作為待選預測因子(共3×(12×2+5)×74=6 438個)。將宜昌站6—9月的洪峰、洪量作為預測目標。把研究時段(1951—2013年)分成兩個部分:1951—1992年作為參數率定期;1993—2013年作為模型驗證期。利用相關系數(Spearman相關系數、Kendall相關系數和Pearson相關系數)法對因子篩選,對于篩選過后的因子,再次通過逐步回歸的方法建立多元線性模型。本文對比了3種相關系數和不同的因子數目的影響,組成了4種方案。具體方案見表1。

      表1 各方案的因子篩選和模型建立過程

      已有的中長期徑流預測中,文獻[2]依據相關系數篩選出20個備選因子,通過向前逐步回歸最終選擇5個因子建立模型。文獻[16]則篩選出17個影響徑流預測的因子,通過主成分分析對17個因子化簡。為更大程度地避免因子選擇的冗余性,本文不僅僅采用逐步回歸方法,還將進行全子集回歸,因此,不妨將通過相關系數選擇的備選因子數目拓展為25個,同時,列出方案4選擇Pearson相關系數的前50個因子作為對比。

      2 基于隨機森林的中長期徑流預測

      隨機森林算法是由加州大學伯克利分校統(tǒng)計系教授Leo于2001年提出來的一種統(tǒng)計學習理論[18]。隨機森林算法第一步采用Bagging[18]方法來組成多個樣本;后對每個樣本進行決策樹建模;最終組合多棵決策樹的預測,通過投票得出最終預測結果。決策樹,又稱為分類回歸樹。決策樹的基本思想是一種二分遞歸分割方法,在計算過程中充分利用二叉樹,在一定的分割規(guī)則下將當前樣本集分割為兩個子樣本集,使得生成的決策樹的每個非葉節(jié)點都有兩個分枝,這個過程又在子樣本集上重復進行,直至不可再分成為葉節(jié)點為止[17]。由于單棵決策樹模型往往精度不高,且容易出現(xiàn)過擬合問題,因此隨機森林模型組合了多個樣本建立了多個決策樹,詳細結構如圖1所示。

      圖1 隨機森林模型的結構示意圖

      隨機森林模型包含兩個重要參數,樣本子集數量M(圖1)和回歸樹節(jié)點劃分待選變量數N。M越大,隨機森林模型的過擬合效應越??;N越大,子預報模型間的差異性越小。一般M取值應較大,N取值應接近總解釋變量數的1/3。

      本文在方案5中使用隨機森林算法進行因子的初選,并與傳統(tǒng)的相關系數法進行對比。由于隨機森林模型可以考慮到較大容量的因子數目,因此本文將所有的6 483項待選因子均作為隨機森林模型的輸入因子,其中的預測目標、率定期、驗證期的選擇與相關系數法徑流預測模型相同。因子的選擇依據Incnodepurity指數[20],即通過計算所有樹變量分割節(jié)點不純性的減少值來比較變量的重要性。本文為了與相關系數選擇法進行對比,選擇隨機森林模型Incnodepurity指數的前25個因子作為線性模型的輸入因子,選擇過的因子作為后續(xù)模型建立的輸入因子,同樣進行逐步回歸、全子集回歸和物理成因篩選,使最終預測因子數目減少到10個左右。文中M取值為20 000,N取值為2 146。

      3 結果與討論

      受篇幅所限,表2中僅列出預測效果較好的方案1、方案3和方案5所選用的預測因子。由表2可以看出,所選擇的預測因子與文獻[14]、文獻[15]和文獻[21]所選擇的預測因子類似,但在時間上有差別,主要包含了物理成因較為明確的西藏高原、南方濤動指數、印度洋副高北界、冷空氣和歐亞環(huán)流指數等因子[21],因此可以認為篩選的因子具有較好的物理成因。最終預測因子數為7個左右,可認為基于逐步回歸、全子集回歸的因子篩選方法有一定的優(yōu)勢且避免了因子篩選的冗余性。

      表2 方案1、3、5的預報因子

      模型精度的評價方法:①《水文情報預報規(guī)范》(GB/T 22482—2008)規(guī)定,預報誤差小于多年變幅的20%為合格[22]。可依此計算預測結果的合格率。②采用Nash系數(即預測結果與實測值的接近程度)進行評價。Nash系數為1,則表示二者最為接近。

      最終方案1—5的預測結果見表3。從Nash系數和合格率來看,基于隨機森林算法的方案5的率定期和驗證期評價參數的差距較小,且合格率達到了90%左右,Nash系數在0.65左右,效果最好。而基于傳統(tǒng)的相關系數法的預測模型的穩(wěn)健性較差,且單獨通過加大相關系數法選擇的因子數目并不能取得較好的優(yōu)勢,反而可能因為因子選擇過多而造成過擬合。采用相關系數法時,方案1基于Pearson相關系數取得的效果最好,方案4由于使用的待選因子數目過多,達到了50個,雖然后來通過逐步回歸、全子集回歸進行篩選,但其驗證期的結果仍較差。圖2與圖3給出了不同模型的預測結果,由圖可知,使用隨機森林算法的模型5具有較大的優(yōu)勢,其預測結果與實測洪峰、洪量最為接近。而單獨利用相關系數的模型1—3的預測效果較差,預測結果偏離實際值較多。

      表3 汛期洪峰、洪量精度評價參數

      圖2 驗證期洪量的實測值和各方案的預測值

      圖3 驗證期洪峰的實測值和各方案的預測值

      4 結語

      基于隨機森林算法的預測模型,無論是模型的穩(wěn)定性還是預測精度,相較于傳統(tǒng)的相關系數法均有大幅提高。究其原因,相較于相關系數法,隨機森林算法由于算法的先進性,可以進行大容量下的重要性選取,且考慮到了因子之間的復雜聯(lián)系。但若依靠相關系數法加大因子篩選的數目,則易因因子選擇過多,而造成過擬合,降低預測的效果。

      本文采用了隨機森林算法、Spearman相關系數法、Kendall相關系數法和Pearson相關系數法作為因子選擇的方法,考慮了預測因子和預測目標間復雜的相關關系及預測因子內部的聯(lián)系,但是僅僅構建了預測因子和預測目標間的多元線性相關關系,未能表達預測因子和預測目標間復雜的非線性關系,故構建有力的非線性預測模型將是下一步的研究工作。

      [1]范鐘秀.中長期水文預報[M].南京:河海大學出版社,1999.

      [2]馮小沖,王銀堂,劉勇,等.基于物理統(tǒng)計方法的丹江口水庫月入庫徑流預報[J].河海大學學報:自然科學版,2011,39(3):242-247.

      [3]卡巴科弗.R語言實戰(zhàn)[M].北京:人民郵電出版社,2013.

      [4]劉荻,周振民.RBF神經網絡在徑流預報中的應用[J].華北水利水電學院學報,2007,28(2):12-14.

      [5]張麗霞,雷曉云.時間序列分解模型在烏拉斯臺河年徑流量預測中的應用研究[J].水資源與水工程學報, 2006,17(2):22-24.

      [6]林劍藝,程春田.支持向量機在中長期徑流預報中的應用[J].水利學報,2006,37(6):681-686.

      [7]鄧娟.三峽水庫入庫徑流中長期預報模型研究及系統(tǒng)開發(fā)與應用[D].武漢:華中科技大學,2011.

      [8]趙文秀,張曉麗,李國會.基于隨機森林和RBF神經網絡的長期徑流預報[J].人民黃河,2015,37(2):10-12.

      [9]WANG Z,LAI C,CHEN X,et al.Flood hazard risk assessment model based on random forest[J].Journal of Hydrology,2015,527:1130-1141.

      [10]趙銅鐵鋼,楊大文,蔡喜明,等.基于隨機森林模型的長江上游枯水期徑流預報研究[J].水力發(fā)電學報,2012,31(3):18-24.

      [11]沈滸英,楊文發(fā),李筱琳.三峽工程大江截流水文氣象預報[J].人民長江,1999,30(9):3-5.

      [12]王雪.長江三峽中長期徑流預報研究及其系統(tǒng)設計與開發(fā)[D].武漢:華中科技大學,2011.

      [13]李維京.現(xiàn)代氣候業(yè)務[M].北京:氣象出版社,2012.

      [14]XU K,BROWN C,KWON H H,et al.Climate teleconnection to Yangtze River seasonal streamflow at Three Gorges Dam,China[J].International Journal of Climatology,2007,27(6):771-780.

      [15]LIU D,GUO S,LIAN Y,et al.Climate-informed low-flow frequency analysis using nonstationary modeling[J].Hydrological Processes,2014,29:2112-2124.[16]劉勇,王銀堂,陳元芳,等.丹江口水庫秋汛期長期徑流預報[J].水科學進展,2010,21(6):771-778.

      [17]HAYES T,USAMI S,JACOBUCCI R,et al.Using classification and regression trees (CART) and random forests to analyze attrition:results from two simulations[J].Psychology & Aging,2015,30(4):911-929.

      [18]PUIMANNOV S.Sorption of arsenic onto Vindhyan shales:role of pyrite and organic carbon[J].Chemical Biology & Drug Design,2014,83(2):198-206.

      [19]BREIMAN L.Bagging predictors[J].Machine Learning,1996,24(2):123-140.

      [20]AKGüNG?R A P,YILDIZ O.Sensitivity analysis of an accident prediction model by the fractional factorial method[J].Accident Analysis & Prevention,2007,39(1):63-68.[21]宋春遠,羅劍琴,饒傳新,等.宜昌市典型伏秋連旱大氣環(huán)流特征分析[C]∥中國氣象學會.中國氣象學會2005年年會論文集.北京:氣象出版社,2005.

      [22]水利部水文局.水文情報預報規(guī)范:GB/T 22482—2008[S].北京:中國標準出版社,2008.

      (責任編輯:陳海濤)

      Medium and Long-term Runoff Prediction of Three Gorges Reservoir Based on Teleconnection

      DONG Qianjin1,2,3, ZHANG Xu1

      (1.State Key Laboratory of Water Resources and Hydropower Engineering Science, Wuhan University, Wuhan 430072, China; 2.Key Laboratory of Poyang Lake Wetland and Watershed Research, Ministry of Education, Jiangxi Normal University, Nanchang 330022, China; 3.Hubei Provincial Collaborative Innovation Center for Water Resources Security, Wuhan University, Wuhan 430072, China)

      The medium and long-term runoff forecast is an important basis for water conservancy and hydropower engineering design, construction and operation management. Predictors-selection and model construction are two key issues in the mid-long term runoff forecasting. In this paper, taking the flow data of Yichang station during the flood season from 1951 to 2013 for an example, based on the 74 circulation characteristics of the National Climate Center, the runoff prediction models based on the correlation coefficient method and the stochastic forest algorithm are constructed respectively. And the influence of different correlation coefficient and factor selection number on prediction accuracy is compared. The results show that the robustness and prediction accuracy of the prediction model based on stochastic forest algorithm can be greatly improved compared with the traditional correlation coefficient method. The study can provide technical support for the long-term runoff forecast and the long-term scheduling plan of the Three Gorges Reservoir.

      mid-long term runoff prediction; hydro-climate teleconnection; random forest algorithm; multi-liner regression; Yichang station

      2016-10-17

      國家自然科學基金資助項目(51439007,51190094);江西省重大生態(tài)安全問題監(jiān)控協(xié)同創(chuàng)新中心資助項目(JXS-EW-00)。

      董前進(1979—),男,湖北安陸人,副教授,博士,從事水資源系統(tǒng)工程方面的研究。E-mail:dqjin@whu.edu.cn。

      10.3969/j.issn.1002-5634.2016.06.007

      TV121;P338

      A

      1002-5634(2016)06-0038-05

      猜你喜歡
      三峽水庫環(huán)流徑流
      內環(huán)流控溫技術應用實踐與發(fā)展前景
      三峽水庫迎戰(zhàn)長江2020年第2號洪水
      中國水利(2020年14期)2020-08-02 16:19:30
      熱鹽環(huán)流方程全局弱解的存在性
      謎底大揭秘
      Topmodel在布哈河流域徑流模擬中的應用
      探秘“大徑流”
      攻克“大徑流”
      兩相坐標系下MMC環(huán)流抑制策略
      江埡水庫降雨徑流相關圖的建立
      三峽水庫澎溪河水-氣界面CO2、CH4擴散通量晝夜動態(tài)初探
      湖泊科學(2014年4期)2014-02-27 10:30:32
      新河县| 清水河县| 北票市| 饶阳县| 阿鲁科尔沁旗| 巨鹿县| 扎兰屯市| 介休市| 麟游县| 义乌市| 金昌市| 开阳县| 阿拉尔市| 湘乡市| 南宫市| 蒙城县| 浦城县| 武乡县| 布尔津县| 桑植县| 石狮市| 呼和浩特市| 棋牌| 台山市| 黔西县| 桐梓县| 东乌| 托里县| 嘉义市| 清远市| 阳西县| 克拉玛依市| 周宁县| 四子王旗| 祥云县| 临漳县| 鄂温| 崇仁县| 宣城市| 东源县| 门头沟区|