• 
    

    
    

      99热精品在线国产_美女午夜性视频免费_国产精品国产高清国产av_av欧美777_自拍偷自拍亚洲精品老妇_亚洲熟女精品中文字幕_www日本黄色视频网_国产精品野战在线观看

      ?

      基于EMD-RF模型的唐山市徑流量預(yù)測研究

      2024-03-01 08:31:08陳研研
      四川水利 2024年1期
      關(guān)鍵詞:徑流量唐山分量

      陳研研

      (河北省唐山水文勘測研究中心,河北 唐山 063000)

      0 引言

      隨著全球氣候變化日益嚴(yán)重,水資源合理利用和預(yù)測成為一個亟待解決的問題。唐山作為我國北方工業(yè)重城,其徑流量變化對城市經(jīng)濟(jì)發(fā)展和人民生活有重要影響,因此,對唐山徑流量進(jìn)行準(zhǔn)確預(yù)測具有實踐意義[1-3]。過去研究中許多學(xué)者采用單一機(jī)器學(xué)習(xí)模型如線性、支持向量機(jī)(SVM)、反向傳播(BP)、極限學(xué)習(xí)機(jī)(ELM)和神經(jīng)網(wǎng)絡(luò)等方法進(jìn)行預(yù)測[2-6]。然而,該方法往往忽視了徑流量序列內(nèi)在隱含的信息,導(dǎo)致預(yù)測準(zhǔn)確性不高。為解決這一問題,本文提出一種基于集合經(jīng)驗?zāi)B(tài)分解(EMD)和隨機(jī)森林(RF)耦合的模型[7-8]。EMD是一種能提取非線性和非平穩(wěn)信號內(nèi)在模式的分解法,可將復(fù)雜徑流量序列分解為一系列的固有模態(tài)函數(shù)(IMFs)。這些IMFs包含徑流量序列主要信息,可以用于后續(xù)預(yù)測模型。而RF是一種強(qiáng)大的機(jī)器學(xué)習(xí)算法,其通過構(gòu)建多個決策樹并結(jié)合它們的結(jié)果來進(jìn)行預(yù)測[8],進(jìn)而可提升模型擬合能力。本文以唐山為例證,以驗證EMD-RF策略的有效性。

      1 研究區(qū)與方法

      1.1 研究區(qū)與數(shù)據(jù)來源

      唐山位于河北東北、渤海灣北岸、燕山南側(cè),地理坐標(biāo)為117°31′~119°19′E、38°55′~40°28′N,總面積13 472 km2。地勢自北向南傾斜,海拔介于0~842 m(見圖1),形成土石山、平原地形,東南為濱海低地,海岸線長229.7 km。屬典型暖溫帶半濕潤大陸型季風(fēng)性氣候,具有四季分明、炎夏寒冬、雨熱同期特點,多年平均氣溫9.6℃,降水量690 mm。主要河流為灤河,河川徑流量14.62億m3,但人均占有量不足全國平均水平的1/10。本研究使用的徑流量資料來自唐山水文局灤河的主要徑流量數(shù)據(jù)。其時間范圍為1960年1月至2020年12月,共計時間尺度60年(720個月)。為確保模型公正性,選取1960-2000年(40年,480個月)的徑流量資料作為訓(xùn)練集,以2001-2020年(20年,240個月)數(shù)據(jù)為驗證集。在運用EMD-RF方法執(zhí)行訓(xùn)練前,需對原數(shù)據(jù)進(jìn)行歸一化處理以減小數(shù)據(jù)噪聲,歸一化方式如下:

      圖1 研究區(qū)地形和主要河流分布

      y=log10(x)

      式中,x、y分別為歸一化之前、后的徑流量[5-7]。

      1.2 隨機(jī)森林算法

      隨機(jī)森林(RF)回歸算法是一種集成學(xué)習(xí)算法,其基本單元是回歸分類樹(Classification and Regression Tree,CART)。在建模過程中,RF會構(gòu)建多個CART,并且每棵CART都是在隨機(jī)選擇的子樣本上獨立進(jìn)行訓(xùn)練的,這樣可以有效地降低過擬合的風(fēng)險。對于新的輸入樣本,RF通過將多棵決策樹的預(yù)測結(jié)果進(jìn)行平均或加權(quán)平均,從而得到最終的回歸結(jié)果。從數(shù)學(xué)的角度來看,RF的目標(biāo)是最小化所有CART的殘差平方和之和。具體而言,有n個樣本和m個特征,則目標(biāo)函數(shù)可以表示為:

      式中,yi是第i個樣本的目標(biāo)值;xij是第i個樣本的第j個特征的值;fj(xij)是第j個特征在第i個樣本上的預(yù)測值。這個目標(biāo)函數(shù)實際上是在尋找一個函數(shù)族,使得所有樣本上的預(yù)測值與真實值之間的差距(即殘差)的平方和最小[6-8]。

      1.3 經(jīng)驗?zāi)B(tài)分解算法

      經(jīng)驗?zāi)B(tài)分解(EMD)算法能夠自適應(yīng)地分解任意復(fù)雜信號為多組分成分[2-5]。其原理是將一個信號投影到時頻平面上,使每次投影成為一個模式分量,對原始信號通過頻率階數(shù)由高至低進(jìn)行分離得到多個模式分量,并保持每個模式分量的時變特性,從而能夠通過頻譜變換計算相應(yīng)的瞬時頻率。其過程如下:

      (1)找到原始信號X(t)的極大值和極小值點,然后通過曲線插值方法對這些極值點進(jìn)行擬合,得到信號的上包絡(luò)線Xmax(t)和下包絡(luò)線Xmin(t)。

      (2)對上下包絡(luò)線求平均值:

      (3)對原始信號X(t)與平均包絡(luò)m1(t)進(jìn)行相減,得到余下信號d1(t)。

      (4)一般情況下,對于平穩(wěn)信號而言,它是原始信號X(t)的第一個模態(tài)函數(shù)(IMF)。但對于非平穩(wěn)信號,信號并不是在某一個區(qū)域內(nèi)單調(diào)遞增的,而是會出現(xiàn)拐點。這些能反映原始信號X(t)的具體特征的拐點若未被選中,則得到的第一階模態(tài)函數(shù)并不準(zhǔn)確,也就是通常得到的d1(t)并不是一個IMF,因此需要對d1(t)進(jìn)行再一次的EMD分解[6-8]。

      2 結(jié)果與分析

      2.1 徑流量時間序列特征

      如圖2所示,研究區(qū)逐月徑流量變化極具躍遷性,觀測到徑流量最高值為172.36 m3/s,另外還存在164.6、151.5、138.6 m3/s的極高值,極小值僅5.03 m3/s,統(tǒng)計平均值18.94 m3/s,變差系數(shù)64.36%,表明月際徑流量變異性強(qiáng)烈。不難分析徑流量序列年內(nèi)存在豐枯交替變化,這與本地雨熱同季的氣候特征一致。經(jīng)線性回歸分析表明,其變化趨勢為y= -0.012 8x+23.397,R2=0.012 6,但并未通過5%水平置信度檢驗,但依然可發(fā)現(xiàn)自近200個月以來的徑流量時變性減弱、極大值減小,表明近年來氣候變化與人類活動影響下區(qū)域徑流量逐漸萎縮,也顯示出徑流量變化的復(fù)雜性。

      圖2 唐山市地表徑流量逐月序列變化

      2.2 徑流量EMD特征

      利用EMD方法對研究區(qū)徑流量進(jìn)行模態(tài)分解,得到7個IMF分量和一個殘差項,其結(jié)果見圖3。該圖直觀呈現(xiàn)了徑流量變化幅值、頻率和時間尺度等特征,幫助了解信號的局部特征和變化趨勢。其中,IMF1-IMF2為高頻分量,其反映了徑流量的逐月、季節(jié)性變化周期,計算得到樣本熵依次為9.87、7.63;IMF3、IMF4為中頻分量,代表了徑流量年際震蕩特性,相應(yīng)的樣本熵為4.32、2.17;IMF5、IMF6、IMF7分別為低頻分量,其承載的信號較低,樣本熵依次為1.63、0.45、0.12。該不同頻率的IMF特征與殘差項的加和可直觀重構(gòu)徑流量變化特征,因此,IMF分量是徑流量的多尺度解析特征。

      圖3 唐山市地表徑流量EMD特征

      2.3 EMD-RF模型建立

      首先運用EMD方法將原徑流量序列分解為若干模態(tài)函數(shù)(IMF)和一些趨勢項殘差(RSE),隨后以此作為解釋變量,分別使用t-1月的數(shù)據(jù)預(yù)測t個月的徑流量,RF可擬合任意非線性的函數(shù)曲面。通過Rstudio開源程序語言Caret工具,設(shè)計RF回歸模型,輸入數(shù)據(jù)為數(shù)值型特征。在RF模型中mtry表示為單一回歸樹中輸入變量數(shù),而ntree為樹總數(shù),全部回歸樹預(yù)測結(jié)果構(gòu)成一片森林,通常mtry和ntree綜合影響RF模型精度。如圖4所示,選定較小的mtry范圍,ntree搜索區(qū)間為100~1 000,最終確定當(dāng)mtry=3、ntree=500時,模型訓(xùn)練精度決定系數(shù)R2達(dá)到最高值,為0.96,由此確定模型結(jié)構(gòu)配置。

      圖4 RF模型精度隨參數(shù)變化趨勢

      2.4 基于EDM-RF模型的徑流量模擬及其精度評價

      將全部7個IMF分量作為

      輸入變量,將訓(xùn)練好的模型帶入數(shù)據(jù)集,仿真生成徑流量變化序列,其結(jié)果見圖5。圖中模型預(yù)測值與實際值之間具有良好一致性,呈現(xiàn)相似漲跌過程,并準(zhǔn)確捕獲了極大、極小過程值。利用納西效率(NSE)、均方根誤差(RMSE)對驗證集進(jìn)行評估,得到NSE為0.93,RMSE僅為7.12 m3/s,顯然該NSE接近于1、RMSE較小,表明該模型預(yù)測精度在可接受范圍內(nèi),該徑流量仿真預(yù)測結(jié)果可信度高。需要指出的是,仍然存在一定誤差,對此尚需進(jìn)一步優(yōu)化改進(jìn)。

      圖5 基于EMD-RF模型的徑流量預(yù)測精度

      3 結(jié)論

      本研究將EMD與RF回歸算法相耦合,新建基于EMD-RF的月徑流量預(yù)測模型,對唐山市近60 a來徑流量進(jìn)行預(yù)報研究,結(jié)論如下:

      (1)唐山月徑流量被劃分為7個IMF分量,其中IMF1、IMF2為高頻分量,IMF3、IMF4為中頻分量,IMF5、IMF6、IMF7為低頻分量;

      (2)在月徑流量預(yù)報時,RF模型表現(xiàn)出良好擬合性能,但需要優(yōu)化配置模型mtry、ntree參數(shù);

      (3)驗證表明EMD-RF模型精度高、誤差較低,該方法有望為月徑流預(yù)測提供新策略。

      猜你喜歡
      徑流量唐山分量
      中國農(nóng)業(yè)發(fā)展銀行唐山分行
      帽子的分量
      唐山香酥饹馇圈
      一物千斤
      智族GQ(2019年9期)2019-10-28 08:16:21
      論《哈姆雷特》中良心的分量
      分量
      水文比擬法在計算河川徑流量時的修正
      王大根
      把唐山打造成為國家級節(jié)能環(huán)保產(chǎn)業(yè)基地
      SCS模型在紅壤土坡地降雨徑流量估算中的應(yīng)用
      肃北| 夏河县| 通海县| 太原市| 鲁山县| 虞城县| 通州区| 宜黄县| 手游| 专栏| 乐昌市| 赤城县| 丰镇市| 仙居县| 阳信县| 仙桃市| 常宁市| 邹城市| 南乐县| 邵武市| 盘山县| 镇宁| 旬阳县| 云梦县| 秦皇岛市| 吴川市| 湖南省| 怀仁县| 大冶市| 泾川县| 博爱县| 拉孜县| 永修县| 航空| 汉源县| 清水河县| 丹凤县| 樟树市| 兰州市| 六安市| 织金县|