劉 磊,陳軍鋒,薛 靜,鄭秀清,杜 琦,崔莉紅,楊小鳳
(1.太原理工大學水利科學與工程學院,太原030024;2.山西省水文水資源勘測局太谷均衡實驗站,山西太谷030800)
凍融期氣候條件惡劣,給土壤蒸發(fā)量的實測帶來了較大困難[1]。由于土壤水分相變導致凍融土壤蒸發(fā)機理復雜[2],傳統(tǒng)經驗公式難以計算凍融期土壤蒸發(fā)量。因此,部分學者開始在土壤水熱耦合模型的基礎上計算凍融期土壤蒸發(fā)量[3,4],但這些模型通常要求輸入大量地面觀測資料、計算過程復雜且參數(shù)率定困難,較難應用于實測資料匱乏地區(qū)的凍融期土壤蒸發(fā)量預測。凍融期土壤蒸發(fā)量與外界氣象條件具有很強的非線性關系。人工智能算法具有極強的學習能力,通過非線性擬合的方式解決實際問題且預測精度較高[5],可較好地用于凍融期土壤蒸發(fā)的預測[6-8]。學習速度快、泛化性能好的極限學習機在非線性函數(shù)擬合、回歸中具有較為明顯的優(yōu)勢。但是,由于該算法的輸入權值及閾值隨機給定,不能直接找到最優(yōu)的參數(shù),影響模型的泛化性能及穩(wěn)定性,導致預測精度不高。因此,眾多學者通過各種優(yōu)化算法對極限學習機回歸預測過程中存在的問題進行了優(yōu)化[9,10]。本文將凍融期土壤蒸發(fā)實測數(shù)據(jù)以及氣象站資料通過隨機函數(shù)處理作為輸入樣本,提出了基于PSO-ELM 模型的凍融期土壤蒸發(fā)預測方法,并與ELM 模型及GA-ELM 模型的預測精度進行對比,為凍融期土壤蒸發(fā)的預測提供了新的思路和方法。
試驗區(qū)位于山西省太原盆地東部,山西省水文水資源勘測局太谷均衡實驗站,地理位置37°26'N、112°30'E,海拔高度777 m,屬大陸性干旱半干旱季風氣候,多年平均(1954-2008年)氣溫9.9 ℃,多年平均降水量415.2 mm,多年平均水面蒸發(fā)量1 642.4 mm,多年平均風速0.9 m/s,多年平均相對濕度74%。
田間試驗于2016年11月22日至2017年3月15日進行,氣溫、氣壓、風速、相對濕度、降水量、水面蒸發(fā)量、太陽輻射均通過氣象站自動監(jiān)測,氣溫、氣壓、風速、相對濕度、以每天8∶00、14∶00、20∶00 這3 個時刻的平均值作為該日數(shù)據(jù),太陽輻射采用基于日照時數(shù)的?ngstr?m-Prescott 模型計算。
表層土壤含水率采用烘干法監(jiān)測,地表土壤溫度采用埋置的熱敏電阻測定,土壤蒸發(fā)量通過PVC 微型蒸發(fā)器采用稱重法監(jiān)測,監(jiān)測時間均為8∶00-9∶00,監(jiān)測周期5~7 d,整個試驗期共監(jiān)測17 次。將表層土壤含水率、地表土壤溫度以及土壤蒸發(fā)量17 組數(shù)據(jù)通過線型內插得到114 組日數(shù)據(jù),與對應的氣象日數(shù)據(jù)組成114組樣本數(shù)據(jù)。
1.3.1 極限學習機
極限學習機(Extreme Learning Machine,ELM)克服了傳統(tǒng)神經網絡訓練速率慢、容易陷入局部最優(yōu)及對學習率敏感等缺點[11],是一種由輸入層、隱含層以及輸出層3 層組成的單隱含層無反向傳播算法的前饋型神經網絡,輸入層、隱含層與輸出層間由神經元相互連接,結構示意圖見圖1。極限學習機模型主要步驟為:①對114組樣本數(shù)據(jù)進行歸一化處理;②將凍融期土壤蒸發(fā)的9個影響因素作為輸入層的輸入變量,土壤蒸發(fā)量作為輸出層的輸出變量,經過多次驗證后隱含層神經元的個數(shù)設置為14;③初始化輸入層與隱含層間的連接權值ω和隱含層神經元偏置b;④選擇隱含層的激活函數(shù)為“sigmoidal”函數(shù),通過廣義逆矩陣理論計算隱含層的輸出矩陣H;⑤計算隱含層與輸出層之間的連接權值β:
式中:H+為H的Moore-Penrose廣義逆;T為期望輸出矩陣。
1.3.2 PSO-ELM 模型的構建
粒子群算法(Particle Swarm Optimizatian,PSO) 是由Eberhart 和Kennedy 通過對鳥群捕食行為研究提出的一種全局優(yōu)化算法[12,13],采用位置、速度以及適應度值3 個指標來描述粒子的特征,通過比較粒子的適應度值確定個體極值、群體極值。根據(jù)公式(2)、(3)更新粒子的位置與速度,粒子每次更新都要重新計算適應度值、確定個體極值和群體極值,一直反復迭代,從而實現(xiàn)在解空間中的尋優(yōu)。
式中:Vkd(t+ 1)為粒子k在第t+1 次迭代中第d維的速度;w為慣性權重,一般取0.9;c1,c2為學習因子;r1,r2為[0,1]范圍內的隨機數(shù);Pbestkd(t)、Gbestkd(t)表示粒子k在個體及群體中的極值位置。
本文采用粒子群優(yōu)化算法對ELM 模型的輸入權值和閾值進行優(yōu)化,每一個粒子都可以看作一個預測土壤蒸發(fā)的ELM模型,采用粒子的位置信息表示ELM 模型的輸入權值和閾值,粒子維數(shù)D及粒子群中第k個粒子θk表示為:
式中:t、n分別為輸入層和隱含層神經元個數(shù);分別為輸入權值和隱含層閾值,均為[-1,1]內的隨機數(shù),1<i<n,1<j<t。
以均方誤差(MSE)作為粒子的適應度函數(shù),尋找所有粒子中的最優(yōu)值,建立PSO-ELM 模型,具體流程見圖2。粒子群算法參數(shù)設置為:粒子群規(guī)模為30,最大迭代次數(shù)為200,學習因子c1=c2=2,慣性權重wmax=0.9,wmin=0.1,粒子維數(shù)為140。
1.3.3 GA-ELM 模型的構建
遺傳算法(Genetic Algorithms,GA)是由美國Holland 教授于1962年提出的,是一種模擬生物遺傳進化建立的并行隨機搜索最優(yōu)化方法[14]。遺傳算法將需要優(yōu)化的ELM 模型的輸入權值及閾值進行編碼,然后根據(jù)所選的適應度函數(shù),通過遺傳過程中的選擇、交叉和變異在群體中進行篩選,得到適應度最優(yōu)的個體,建立GA-ELM 模型,具體流程見圖3。遺傳算法參數(shù)設置為:初始種群數(shù)量為20 個,個體編碼方式為二進制,交叉概率為0.7,變異概率為0.01,最大遺傳代數(shù)為100。
為了評價凍融期土壤蒸發(fā)預測精度,本文以均方根誤差(RMSE)、平均相對誤差(MRE)、平均絕對誤差(MAE)以及決定系數(shù)R2作為預測結果的評價指標。評價公式如下:
式中:yi、分別為土壤蒸發(fā)量實測值和預測值。
2016-2017年凍融期可分為不穩(wěn)定凍結期(2016年11月7日至12月26日)、穩(wěn)定凍結期(2016年11月27日至2017年2月2日)及消融解凍期(2017年2月3日至3月15日)[16]。不穩(wěn)定凍結期氣溫在0 ℃上下波動,土壤表層出現(xiàn)“晝融夜凍”的現(xiàn)象,土壤蒸發(fā)較為強烈;穩(wěn)定凍結期凍層深度持續(xù)增加,穩(wěn)定密實的凍土層令表層和下層土壤水的聯(lián)系切斷,土壤蒸發(fā)量較少;消融解凍期氣溫回升,土壤凍層呈現(xiàn)自表層向下及下層向上的“雙向融化”的現(xiàn)象,融化后的水分補充土壤表層導致土壤蒸發(fā)強烈。3個階段由于土壤物理性質不同,即使在相同外界氣象條件下土壤蒸發(fā)量也會存在較大差異。前人對凍融期土壤蒸發(fā)的模擬均是以不穩(wěn)定凍結期、穩(wěn)定凍結期的實測土壤蒸發(fā)量及其9個影響因素作為訓練樣本,來預測消融解凍期的土壤蒸發(fā)量[9-11],預測結果代表性較差。本文在前人研究基礎上,對未隨機排列的數(shù)據(jù)和隨機排列后的數(shù)據(jù)分別通過PSO-ELM 模型進行預測,預測精度結果變化見表1。樣本數(shù)據(jù)隨機排列后的預測精度相較于未隨機排列有了較大提升,減少了特定凍融階段的土壤蒸發(fā)量作為訓練樣本或預測樣本對預測結果的影響。
表1 隨機函數(shù)處理前后評價預測精度變化Tab.1 Change of prediction accuracy before and after random function processing
為了說明PSO-ELM 模型的優(yōu)勢所在,在生成的114 組樣本數(shù)據(jù)中,通過隨機函數(shù)處理將數(shù)據(jù)打亂,隨機選取其中90組作為訓練樣本數(shù)據(jù),剩余24 組作為測試樣本數(shù)據(jù)。分別使用ELM 模型、GA-ELM 模型和PSO-ELM 模型對凍融期土壤蒸發(fā)量進行預測,對比3 種預測結果來說明PSO-ELM 模型的優(yōu)勢。預測結果見圖4,評價指標計算結果見表2。
由圖4 及表2 可見,3 種模型預測值均分布在實測值上下兩側,其中PSO-ELM 模型擬合效果最好,GA-ELM 模型次之,ELM 模型最差,PSO-ELM 模型決定系數(shù)R2為0.993 6,均方根誤差為0.010 9 mm/d,平均相對誤差為4.91%,平均絕對誤差為0.007 9 mm/d。
表2 3種不同模型評價指標計算結果Tab.2 Calculation results of evaluation indexes of three different models
3種模型土壤蒸發(fā)訓練樣本和實測樣本的實測值及預測值的絕對誤差和相對誤差結果分析見圖5。單一ELM 模型訓練及預測誤差均大于允許誤差(20%),說明在凍融期土壤蒸發(fā)資料匱乏情況下單一ELM 模型由于輸入權值和閾值隨機給定導致難以尋找到最優(yōu)參數(shù),容易出現(xiàn)欠擬合現(xiàn)象,降低預測精度;GA-ELM 模型與PSO-ELM 模型相比訓練誤差相差不大,但預測誤差卻遠大于PSO-ELM 模型,說明當訓練樣本數(shù)量較少時GA-ELM 模型在訓練過程中容易出現(xiàn)過擬合現(xiàn)象,降低了凍融期土壤蒸發(fā)預測的精度;PSO-ELM 模型絕對誤差上限、相對誤差上限、絕對誤差上四分位數(shù)、相對誤差上四分位數(shù)、絕對誤差中位數(shù)、相對誤差中位數(shù)等各項指標均小于其他2個模型并且處于允許誤差范圍內,表明PSO-ELM 模型更適合用來預測凍融期土壤蒸發(fā)。
綜上可知,3 種模型中PSO-ELM 模型預測精度最高、預測效果最好,GA-ELM 模型次之,單一ELM 模型精度最低,說明PSO-ELM模型更適用于凍融期土壤蒸發(fā)的預測。
(1) 通過與單一ELM 模型及GA-ELM 模型對比發(fā)現(xiàn),PSO-ELM 模型的預測樣本預測值與實測值擬合程度最高,預測效果最好,PSO-ELM 模型的決定系數(shù)為0.993 6,均方根誤差為0.010 9 mm/d,平均相對誤差為4.91%,平均絕對誤差為0.007 9 mm/d,模型決定系數(shù)大于0.9,平均相對誤差小于10%,說明所建立的PSO-ELM 模型可較好用于凍融期土壤蒸發(fā)預測。
(2)通過隨機函數(shù)對樣本數(shù)據(jù)進行處理減少了特定凍融階段的土壤蒸發(fā)量作為訓練樣本或預測樣本對預測結果的影響,提高了模型的預測精度,為干旱、半干旱地區(qū)凍融期土壤蒸發(fā)預測提供了一種新的思路。