• 
    

    
    

      99热精品在线国产_美女午夜性视频免费_国产精品国产高清国产av_av欧美777_自拍偷自拍亚洲精品老妇_亚洲熟女精品中文字幕_www日本黄色视频网_国产精品野战在线观看 ?

      基于經(jīng)驗?zāi)B(tài)分解和支持向量機(jī)的日徑流預(yù)測研究

      2023-10-30 00:56:50萬新宇王鑫宇侯添甜林曉夢
      水力發(fā)電 2023年10期
      關(guān)鍵詞:榕江包絡(luò)線徑流

      萬新宇,王鑫宇,侯添甜,林曉夢

      (河海大學(xué)水文水資源學(xué)院,江蘇 南京 210024)

      0 引 言

      徑流預(yù)測是水資源開發(fā)利用與管理的重要依據(jù)[1],但徑流形成具有顯著的非線性特征,預(yù)測難度大。因此,徑流預(yù)測一直是水資源領(lǐng)域研究的熱點問題,過程驅(qū)動模型和數(shù)據(jù)驅(qū)動模型是當(dāng)前徑流預(yù)測常用的兩類方法[2]。過程驅(qū)動模型建立在流域產(chǎn)匯流的機(jī)理上,利用水文學(xué)方法對徑流形成過程進(jìn)行模擬,如新安江模型、SWAT模型及TOPMODEL模型等。數(shù)據(jù)驅(qū)動模型則是根據(jù)數(shù)理統(tǒng)計原理,深入挖掘輸入與輸出數(shù)據(jù)之間的相關(guān)關(guān)系,建立徑流預(yù)測模型,如多元線性回歸[1]、支持向量機(jī)[3-6]、神經(jīng)網(wǎng)絡(luò)模型[7-10]等,均在徑流預(yù)測中取得了較為可觀的成果。

      近年來,隨著深度學(xué)習(xí)理論的快速發(fā)展,一種改進(jìn)的循環(huán)神經(jīng)網(wǎng)絡(luò)——長短期記憶神經(jīng)網(wǎng)絡(luò)(LSTM)在徑流預(yù)測中得到了較為廣泛的應(yīng)用[7,9-10],如孫望良等基于DFA-VMD處理的數(shù)據(jù)集通過LSTM模型對三峽水庫進(jìn)行日徑流預(yù)測,結(jié)果表明其性能優(yōu)于BP模型[7]。此外,支持向量機(jī)(SVM)作為監(jiān)督機(jī)器學(xué)習(xí)模型可以用于異常值檢測以及預(yù)測序列,顧哲衍等對黃尾河徑流預(yù)測研究中發(fā)現(xiàn)在高精度模擬上,SVM模型優(yōu)于BP模型[11]。當(dāng)前徑流預(yù)測的研究方向著重于優(yōu)化模型,以達(dá)到更好的預(yù)測效果,針對數(shù)據(jù)驅(qū)動模型的輸入步長(滑動窗口)的討論較少,孫傳文等通過構(gòu)建三峽水庫的季節(jié)性SVM模型進(jìn)行月徑流預(yù)測,結(jié)果優(yōu)于BP神經(jīng)網(wǎng)絡(luò)模型和標(biāo)準(zhǔn)SVM模型[6]。王爽等通過對歷史時間序列進(jìn)行自相關(guān)分析選擇最佳輸入步長,在最小二乘支持向量機(jī)(LSSVM)和LSTM的預(yù)測中獲得了較好的預(yù)測效果[12]。為了能較為清楚直觀且有依據(jù)地選擇輸入步長,使用自相關(guān)函數(shù)分析水文數(shù)據(jù)的相關(guān)性,提高預(yù)測精度。

      由于水文徑流序列具有非線性與非平穩(wěn)性[13],單一深度學(xué)習(xí)預(yù)報模型在訓(xùn)練過程中易受噪聲信號干擾,導(dǎo)致對時間序列內(nèi)部規(guī)律的變化不能明顯識別,影響預(yù)測精度。為此,本研究引入一種自適應(yīng)信號時頻分解方法——經(jīng)驗?zāi)B(tài)分解(EMD)對日徑流序列進(jìn)行分解,識別其內(nèi)部變化規(guī)律,構(gòu)建基于EMD和SVM耦合的日徑流預(yù)測模型,以提高徑流預(yù)測精度。與經(jīng)典小波分析相比,EMD方法具有更好的抗噪能力,并已成功應(yīng)用于非線性數(shù)據(jù)的處理分析中[12,14]。

      綜上所述,本文將對我國南方榕江流域日徑流序列進(jìn)行自相關(guān)分析,以及采用EMD方法對該數(shù)據(jù)進(jìn)行適當(dāng)分解,在決定輸入步長的同時確定預(yù)測模型的輸入數(shù)據(jù),使用EMD-SVM模型對控制流域日徑流預(yù)測,并設(shè)立LSTM、SVM、BP模型作為對照模型,以驗證所建模型的預(yù)測性能。

      1 研究方法

      1.1 自相關(guān)分析

      對于時間序列,自相關(guān)函數(shù)[15]主要用于分析該序列和其本身k階滯時后的時間序列之間的相關(guān)程度,衡量歷史序列對n時刻的影響。在徑流數(shù)據(jù)中,自相關(guān)分析常用于研究時間序列自身隨滯時增加而變化的周期性特征及檢驗徑流序列自身相依性,同時可根據(jù)自相關(guān)程度判斷模型輸入數(shù)據(jù)和預(yù)測數(shù)據(jù)的關(guān)聯(lián)性。

      自相關(guān)系數(shù)公式為

      式中,k為滯時(時移)步長,k=0,1,2,…,n;cov(Xt,Xt+k)為Xt和Xt+k的協(xié)方差;σXt、σXt+k分別為Xt和Xt+k的均方差。

      因為水文序列具有波動性,在徑流數(shù)據(jù)自相關(guān)分析中可選擇顯著性水平α,設(shè)置容許限。取α=5%,容許限水平為1-α=95%,公式為

      式中,取負(fù)號為下限,取正號為上限,位于容許限外認(rèn)為該序列具有相關(guān)性,反之該序列獨立。

      1.2 經(jīng)驗?zāi)B(tài)分解

      經(jīng)驗?zāi)B(tài)分解(EMD)是由Huang于1998年提出的一種新型自適應(yīng)處理非平穩(wěn)信號的方法,不同于小波分解法與傅里葉變換法,EMD方法在理論上可以適用將任何一種類型的時間序列(信號)分解成不同時間尺度的時間序列(信號)分量,因而在對徑流時間序列這種非線性數(shù)據(jù)的處理上,效果顯著優(yōu)于傳統(tǒng)時頻處理方法。EMD能夠?qū)?fù)雜的信號根據(jù)其自身時間尺度特征分解成為有限個本征模函數(shù)(IMF)和一個殘差r(t),其中每個IMF都含有原始時間序列中不同尺度的局部特征信號,r(t)殘差所表現(xiàn)的多為原始序列的整體趨勢。分解得到的IMF需要滿足以下兩個約束:

      (1)在整個數(shù)據(jù)集中,IMF含有的極值點數(shù)與零點數(shù)必須相等或最多相差1。

      (2)在任何一點上,由局部最小值形成的下包絡(luò)線和由局部最大值形成的上包絡(luò)線的平均值應(yīng)等于0。

      對徑流時間序列進(jìn)行EMD分解分為以下步驟:

      (1)根據(jù)原始徑流時間序列信號x(t)確定上下極值點,分別畫出下包絡(luò)線amin(t)、上包絡(luò)線amax(t)。

      (2)求出下包絡(luò)線amin(t)、上包絡(luò)線amax(t)的均值,得到徑流時間序列均值包絡(luò)線m1(t)。公式為

      (3)原始徑流時間序列信號x(t)減去均值包絡(luò)線m1(t),得到去除低頻信號的新時間序列信號h1(t)。公式為

      h1(t)=x(t)-m1(t)

      (4)

      (4)判斷該h1(t)是否滿足IMF的上述兩個約束,若不滿足,則以h1(t)為基礎(chǔ),重做上述(1)~(3)的分析直至滿足約束;如果滿足,記c1(t)=h1(t),該信號c1(t)作為第一個IMF分量,并將原始徑流時間序列信號x(t)減去c1(t),得到一個去除高頻信號的殘余分量r1(t)作為新的徑流時間序列信號。公式為

      r1(t)=x(t)-c1(t)

      (5)

      (5)重復(fù)上述步驟,得到x(t)的第n個IMF分量cn(t),當(dāng)殘余分量rn(t)滿足EMD分解終止條件(通常至rn(t)成為一個單調(diào)函數(shù)),循環(huán)結(jié)束。

      最終可以分解為n個IMF分量和一個殘差rn(t)。公式為

      (6)

      1.3 支持向量機(jī)

      支持向量機(jī)(SVM)是一種根據(jù)預(yù)選的非線性映射,把輸入向量投映至某一個高緯度的特征空間,并通過最優(yōu)用于分類的超平面的分類過程。SVM通過統(tǒng)計學(xué)習(xí)理論的VC維理論和結(jié)構(gòu)風(fēng)險最小化原理建立,其構(gòu)架形式與多層感知器網(wǎng)絡(luò)相似。

      設(shè)有n個訓(xùn)練樣本集合:{(xi,yi)},i=1,2,…,n,其中xi為輸入向量的元素,yi為預(yù)測向量的元素。SVM在高緯特征空間的線性回歸函數(shù)為

      f(x)=ωφ(x)+b

      (7)

      式中,ω為超平面法向量;φ(x)為非線性函數(shù);b為超平面偏置項。

      使用懲罰因子C和松弛變量ζ、ζ*,求解ω和b的凸二次規(guī)劃,得到回歸函數(shù)

      (8)

      式中,αi、αi*為二次規(guī)劃Lagrange乘子;K(·)為任意滿足Mercer條件的核函數(shù)。

      SVM模型結(jié)構(gòu)示意如圖1。核函數(shù)K(·)將兩個低維空間的向量,計算經(jīng)某一變換后在高維空間的向量內(nèi)積值,是構(gòu)建SVM的關(guān)鍵成分。

      圖1 SVM結(jié)構(gòu)示意

      1.4 EMD-SVM模型構(gòu)建

      EMD-SVM模型構(gòu)建步驟如下,其模型構(gòu)建的技術(shù)路線如圖2所示。

      圖2 技術(shù)路線

      步驟1。為提高SVM預(yù)測精度,使用自相關(guān)分析對日徑流時間序列進(jìn)行預(yù)處理,通過自相關(guān)系數(shù)大小確定模型的輸入步長。

      步驟2。利用EMD算法將日徑流時間序列分解為不同時間尺度的IMF分量和一個殘差r(t)。

      步驟3。將徑流時間序列數(shù)據(jù)按3∶1劃分訓(xùn)練集和測試集,通過試錯法尋找SVM最優(yōu)懲罰因子C。

      步驟4。濾除殘差r(t),將各個IMF的預(yù)測結(jié)果相加求和作為EMD-SVM模型最終預(yù)測結(jié)果。

      1.5 評價指標(biāo)

      本文選取平均絕對百分比誤差(MAPE)、均方根誤差(RMSE)、納什效率系數(shù)(NSE)3項指標(biāo)評價模型性能。各計算公式為

      (9)

      (10)

      (11)

      MAPE值越接近0,表明模型誤差越小;RMSE表示預(yù)測值與觀測值的偏差,其值越小表明偏差越小,預(yù)測效果越好;NSE反映水文過程的擬合效果,取值范圍(-∞,1],當(dāng)值越接近1,表明水文過程擬合效果越好,可以更加直觀了解模型預(yù)測結(jié)果的精度和可靠性。

      2 研究實例

      榕江屬于南海水系,是廣東粵東地區(qū)第二大河流,也是連接香港與廣州的重要航運通道。榕江流域河段總長度176 km,自西向東流經(jīng)汕尾市、揭陽市、汕頭市3市。其中南河為榕江流域主流,上游部分河道縱比降較大,由于榕江流域暴雨多,洪水傳播迅速,易發(fā)生旱澇災(zāi)害。因此,高精度的徑流預(yù)報對榕江流域及時發(fā)布預(yù)警,合理調(diào)控水資源發(fā)揮重要作用。榕江流域DEM數(shù)據(jù)圖如圖3所示。

      圖3 榕江流域DEM

      本文以榕江流域南河的東橋園站為研究對象。東橋園站集水面積2 016 km2,多年平均年徑流31.1億m3;搜集選取東橋園水文站2006年1月1日~2011年3月29日的逐日歷史徑流數(shù)據(jù)作為EMD-SVM日徑流預(yù)測模型的訓(xùn)練期進(jìn)行測試,2011年3月30日~2012年12月31日的逐日歷史徑流數(shù)據(jù)作為預(yù)測模型的檢驗期。

      3 結(jié)果與討論

      3.1 日徑流數(shù)據(jù)自相關(guān)分析

      合理選擇預(yù)測因子直接影響模型的預(yù)測精度,選擇東橋園站日徑流序列作為模型主要輸入,日徑流數(shù)據(jù)的自相關(guān)系數(shù)和容許限如圖4所示。從圖4中可知,當(dāng)滯時k為3和9時,自相關(guān)系數(shù)位于容許限內(nèi),視為與歷史數(shù)據(jù)沒有相關(guān)性;當(dāng)k為1和6時,自相關(guān)系數(shù)在容許限外且數(shù)值最大,但較長的滯時通過EMD分解,能使預(yù)測模型更好的學(xué)習(xí)徑流時間序列內(nèi)部規(guī)律,提高預(yù)測性能。因此,可認(rèn)為當(dāng)輸入步長為6時,對預(yù)測精度的影響最大。

      圖4 東橋園站日徑流自相關(guān)分析

      3.2 EMD分解日徑流數(shù)據(jù)結(jié)果

      東橋園站日徑流序列分解結(jié)果如圖5所示。原始序列通過EMD分解,當(dāng)重構(gòu)EMD迭代次數(shù)設(shè)定為10時,得到10個IMF分量和1個殘余函數(shù)r(t)。由圖5可以發(fā)現(xiàn),各IMF的頻率由高到低遞減,IMF1至IMF6的波動幅度較大,反映了原始徑流量在不同情況下的變化趨勢;IMF7至IMF10波形較為平緩,反映了原始徑流量的隨機(jī)性,各個分量的值較平均分布于零的兩側(cè),EMD分解較為直觀地顯示了對日徑流序列擾動較低的原始序列特征,故模型通過這些分量可以更精準(zhǔn)地學(xué)習(xí)徑流序列的規(guī)律性特征,之后進(jìn)行預(yù)測,預(yù)測誤差會減小。

      圖5 東橋園日徑流EMD分解

      對EMD分解后得到的各個IMF序列建立各自SVM預(yù)測模型。使用子預(yù)測模型對各個子序列進(jìn)行預(yù)測,并將徑流預(yù)測值相加求和,獲得最終預(yù)測結(jié)果。

      3.3 SVM模型參數(shù)設(shè)置

      SVM模型的懲罰因子C用來衡量目標(biāo)函數(shù)損失的權(quán)重,當(dāng)選取懲罰因子越大,表明對于錯誤樣的懲罰程度越大,但存在過擬合的現(xiàn)象,降低模型泛化能力。故選取C(100、 200、 300、400、500、600、700、800、900、1 000、1 100、1 200)進(jìn)行試驗,選用預(yù)測結(jié)果最好的一組超參數(shù)。本文為了獲得更佳的預(yù)測結(jié)果,選擇多項式核(Polynomial kernal)作為SVM核函數(shù),以未經(jīng)EMD處理的測試集作為輸入數(shù)據(jù),不同懲罰因子C的測試結(jié)果如表1所示。

      表1 不同懲罰因子C的測試結(jié)果

      由表1可知,懲罰因子C在100~800范圍內(nèi),對預(yù)測結(jié)果的影響較大;在800~1 200范圍內(nèi),3項評價指標(biāo)幾乎不變,但模型運行時間有所增長。因此,當(dāng)懲罰因子C選取800時,SVM模型具有較好的綜合表現(xiàn)效果。

      對各個IMF分量建立SVM模型,核函數(shù)kernel選擇poly函數(shù),多項式poly核函數(shù)的維度degree為3,核函數(shù)系數(shù)gamma選擇auto。

      3.4 模型預(yù)測效果

      EMD-SVM模型的預(yù)測結(jié)果如圖6所示,然后將EMD-SVM模型的預(yù)測結(jié)果與SVM、LSTM、BP模型的預(yù)測結(jié)果進(jìn)行橫向?qū)Ρ龋鐖D7~9所示,以此驗證該組合模型預(yù)測結(jié)果的精度與可靠性,SVM模型采用與EMD-SVM模型相同的參數(shù)及變量設(shè)置。

      圖6 EMD-SVM模型預(yù)測值與實際值對比

      圖7 SVM模型預(yù)測值與實際值對比

      圖9 LSTM模型預(yù)測值與實際值對比

      為了直觀地比較SVM預(yù)測模型結(jié)合EMD算法所得徑流量預(yù)測結(jié)果的精度,顯然,通過圖6~9可知,在大流量的時間序列預(yù)測上神經(jīng)網(wǎng)絡(luò)的BP模型誤差明顯較大且數(shù)值偏小,LSTM模型預(yù)測浮動范圍大,會出現(xiàn)預(yù)測值遠(yuǎn)大于實際值的現(xiàn)象,SVM模型存在和BP同樣的問題;在中小流量的時間序列預(yù)測上SVM模型比LSTM、BP模型具有更高的預(yù)測精度。通過圖6與圖7、8、9對比,顯然使用EMD算法對徑流時間序列預(yù)先分解再分別進(jìn)行預(yù)測,得到的結(jié)果更加接近真實值。

      EMD算法較好地彌補(bǔ)了SVM模型在大流量預(yù)測上的不足,實現(xiàn)了大中小流量較高精度的預(yù)測,明顯地提升了預(yù)測效果。各模型訓(xùn)練期與檢驗期的3項誤差指標(biāo)對比如表2所示。

      表2 東橋園水文站日徑流預(yù)測結(jié)果對比

      由表2可以得出以下結(jié)論:

      (1)在訓(xùn)練期,BP模型在RMSE和NSE指標(biāo)上優(yōu)于EMD_SVM模型,明顯優(yōu)于LSTM、SVM模型,但在MAPE指標(biāo)上效果略劣于其他模型。在檢驗期,BP模型在RMSE、MAPE指標(biāo)上高于其他模型,NSE指標(biāo)低于其他模型,BP的預(yù)測性能大幅下降。

      (2)預(yù)測模型在檢驗期可以更好地表現(xiàn)其真實性能。RMSE指標(biāo)方面,EMD-SVM模型比SVM、BP、LSTM模型分別降低了19.60%、31.90%、29.66%;NSE指標(biāo)方面,EMD-SVM模型比SVM、BP、LSTM模型分別提高了10.62%、24.50%、21.82%;MAPE指標(biāo)方面,EMD-SVM模型比SVM、BP、LSTM模型分別減小0.024 8、0.082 5、0.001 7。因此,說明EMD-SVM模型的預(yù)測結(jié)果在檢驗期具有更高的精度,更加適用于研究區(qū)域的徑流預(yù)測。

      (3)通過大量數(shù)據(jù)對預(yù)測模型進(jìn)行訓(xùn)練,相對于其他3個模型,LSTM神經(jīng)網(wǎng)絡(luò)模型在訓(xùn)練期和檢驗期的模擬效果均不突出。

      (4)由于徑流序列具有非平穩(wěn)性和非線性性,且序列中多含有噪聲的特征,使用SVM模型直接進(jìn)行預(yù)測會降低對徑流量的擬合效果。EMD分解可以對原始時間序列數(shù)據(jù)進(jìn)行自適應(yīng)分解,較為有效地提高了模型預(yù)測的精度。

      4 結(jié) 論

      本文按照自相關(guān)性分析—徑流序列分解—分項逐一預(yù)測—結(jié)果累加的技術(shù)路線建立EMD-SVM的時間序列耦合模型,榕江流域東橋園站作為研究區(qū)域,以日徑流時間序列預(yù)測為實例對該耦合模型進(jìn)行試驗,得到如下結(jié)論:

      (1)對于徑流等這類水文數(shù)據(jù)與時間關(guān)系密切相關(guān)的序列,建議選取自相關(guān)系數(shù)較大的輸入步長,預(yù)測誤差較低。

      (2)使用EMD分解對日徑流時間序列進(jìn)行自適應(yīng)分解,可以呈現(xiàn)多個更好反映原序列的時間子序列,選擇具有不同尺度特征和代表整體趨勢的分量作為模型的輸入數(shù)據(jù),可以起到更好的預(yù)測效果。大規(guī)模高質(zhì)量的訓(xùn)練數(shù)據(jù)集可以使模型更好地預(yù)測徑流量。

      (3)SVM模型的超參數(shù)需要進(jìn)行選優(yōu),超參數(shù)選擇的不同對徑流量的預(yù)測效果有較大的影響,特別是核函數(shù)。EMD-SVM模型在榕江流域南河?xùn)|橋園水文站日徑流預(yù)測中具有較好的模擬效果,可以應(yīng)用于榕江流域日徑流預(yù)測。

      (4)EMD-SVM徑流預(yù)測模型隨預(yù)見期延長預(yù)測效果如何變動,及和其他數(shù)據(jù)驅(qū)動模型對比效果有待深入研究。

      猜你喜歡
      榕江包絡(luò)線徑流
      平面曲線運動中的包絡(luò)線問題探討
      黔中訪古·榕江客家圍屋
      拋體的包絡(luò)線方程的推導(dǎo)
      一種用于故障隔離的參數(shù)區(qū)間包絡(luò)線計算方法
      榕江“薩瑪節(jié)”
      快樂童年——榕江侗族兒童
      藏在深山中的蠟花
      ———榕江苗族蠟染
      Topmodel在布哈河流域徑流模擬中的應(yīng)用
      探秘“大徑流”
      攻克“大徑流”
      甘肃省| 东光县| 邵阳县| 通江县| 衡阳市| 横峰县| 古田县| 呼玛县| 扎兰屯市| 五台县| 台安县| 呼图壁县| 上杭县| 固安县| 海原县| 霞浦县| 陆河县| 弥渡县| 江西省| 会泽县| 澳门| 阿荣旗| 丰顺县| 藁城市| 孟村| 绵阳市| 利辛县| 科技| 潼南县| 无锡市| 南部县| 容城县| 岗巴县| 宜昌市| 万州区| 竹溪县| 绍兴市| 陕西省| 突泉县| 安顺市| 定结县|