王澤平
(云南省水文水資源局麗江分局,云南麗江674100)
湖泊營(yíng)養(yǎng)狀態(tài)的客觀評(píng)價(jià)對(duì)于湖泊的可持續(xù)管理和保護(hù)都具有重要意義。目前湖泊營(yíng)養(yǎng)狀態(tài)的評(píng)價(jià)方法主要有模糊度法、多目標(biāo)模糊灰色決策法、模糊數(shù)學(xué)運(yùn)算法、灰色局勢(shì)決策、灰色聚類法、灰色層次決策法、主分量分析法等等,這些研究取得了一定的成果,但也存在一些問(wèn)題。由于湖泊營(yíng)養(yǎng)狀態(tài)的評(píng)價(jià)是通過(guò)與湖泊營(yíng)養(yǎng)狀態(tài)有關(guān)的一系列指標(biāo)及指標(biāo)間的相互關(guān)系,對(duì)湖泊的營(yíng)養(yǎng)狀態(tài)做出準(zhǔn)確的判斷[1],識(shí)別過(guò)程具有高維、非線性的特征,適宜借助諸如人工智能、模糊識(shí)別、知識(shí)工程等方法建立模型,以處理多指標(biāo)系統(tǒng)的綜合識(shí)別問(wèn)題[2]。人工神經(jīng)網(wǎng)絡(luò) (Artifical Neural Network,ANN)具有較強(qiáng)的非線性映射能力、魯棒性、容錯(cuò)性和自適應(yīng)、自組織、自學(xué)習(xí)等許多特性,適宜解決高維、非線性系統(tǒng)問(wèn)題,BP網(wǎng)絡(luò) (Back-Propagation Network,BP)無(wú)疑是ANN最為常用的神經(jīng)網(wǎng)絡(luò)模型之一,廣泛應(yīng)用于湖庫(kù)營(yíng)養(yǎng)狀態(tài)研究中[3~5]。然而,標(biāo)準(zhǔn)BP神經(jīng)網(wǎng)絡(luò)存在著學(xué)習(xí)收斂速度慢、易陷入局部極值的不足,針對(duì)這一缺點(diǎn),筆者依據(jù)我國(guó)湖泊營(yíng)養(yǎng)狀態(tài)評(píng)價(jià)標(biāo)準(zhǔn)和BP原理及方法,提出LM-BP神經(jīng)網(wǎng)絡(luò)湖泊庫(kù)營(yíng)養(yǎng)狀態(tài)評(píng)價(jià)模型,采用隨機(jī)內(nèi)插的方法在各分級(jí)標(biāo)準(zhǔn)閾值間生成訓(xùn)練樣本和檢驗(yàn)樣本,在訓(xùn)練樣本和檢驗(yàn)樣本達(dá)到期望的精度要求后,用于麗江程海及瀘沽湖2008~2012年?duì)I養(yǎng)狀態(tài)評(píng)價(jià),并構(gòu)建RBF神經(jīng)網(wǎng)絡(luò)模型作為對(duì)比,為湖泊營(yíng)養(yǎng)狀態(tài)的評(píng)價(jià)提供新的途徑和方法。
BP神經(jīng)網(wǎng)絡(luò)是一種單向傳播的多層前饋神經(jīng)網(wǎng)絡(luò),其主要特點(diǎn)是信號(hào)前向傳播,誤差反向傳播。在前向傳播中,輸入信號(hào)從輸入層經(jīng)隱含層逐層處理,直至輸出層。每一層的神經(jīng)元狀態(tài)只影響下一層神經(jīng)元狀態(tài),如果輸出層得不到期望輸出,則轉(zhuǎn)入反向傳播,根據(jù)預(yù)測(cè)誤差調(diào)整網(wǎng)絡(luò)權(quán)值和閾值,從而使BP神經(jīng)網(wǎng)絡(luò)預(yù)測(cè)輸出不斷逼近期望輸出。由非線性變換單元組成的BP神經(jīng)網(wǎng)絡(luò),不僅結(jié)構(gòu)簡(jiǎn)單 (僅含輸入、輸出和隱節(jié)點(diǎn)3層),而且具有良好的非線性映射能力。BP網(wǎng)絡(luò)主要應(yīng)用于函數(shù)逼近、模式識(shí)別、分類和數(shù)據(jù)壓縮等領(lǐng)域。限于篇幅,其網(wǎng)絡(luò)的拓?fù)浣Y(jié)構(gòu)及算法步驟可參閱相關(guān)文獻(xiàn) [6~9]。
由于標(biāo)準(zhǔn)梯度BP算法在最初幾步下降較快,但隨著接近最優(yōu)值,梯度趨于零,導(dǎo)致誤差函數(shù)下降緩慢,而牛頓法則可在最優(yōu)值附近產(chǎn)生一個(gè)理想的搜索方向。Levenberg-Marquardt法實(shí)際上是梯度下降法和牛頓法的結(jié)合,其比傳統(tǒng)的BP及其他改進(jìn)算法有迭代次數(shù)少、收斂速度快和精確度高等優(yōu)點(diǎn)。L-M算法基本思想是使其每次迭代不再沿著單一負(fù)梯度方向,而是允許誤差沿著惡化的方向進(jìn)行搜索,同時(shí)通過(guò)在最速梯度下降和高斯-牛頓法之間自適應(yīng)調(diào)整來(lái)優(yōu)化網(wǎng)絡(luò)權(quán)值,使網(wǎng)絡(luò)能夠有效收斂,提高網(wǎng)絡(luò)的收斂速度和泛化能力。
其權(quán)值調(diào)整公式為:
式中:e為誤差向量;JT為誤差對(duì)權(quán)值微分的雅可比矩陣;μ為標(biāo)量。MATLAB中的工具函數(shù)trainlm()即對(duì)應(yīng)Levenberg-Marquardt法的改進(jìn)算法[8]。
依據(jù)水利部《地表水資源質(zhì)量評(píng)價(jià)技術(shù)規(guī)程》(SL395-2007)湖泊營(yíng)養(yǎng)狀態(tài)評(píng)價(jià)標(biāo)準(zhǔn)[10],選取葉綠素a(Chla)、總磷 (TP)、總氮 (TN)、高錳酸鹽指數(shù) (CODMn)和透明度 (SD)作為湖庫(kù)營(yíng)養(yǎng)狀態(tài)評(píng)價(jià)指標(biāo),并參考文獻(xiàn) [7,11],選取重富營(yíng)養(yǎng)臨界值的2倍作為評(píng)價(jià)指標(biāo)極大值 (上限值),貧營(yíng)養(yǎng)臨界值的0.5倍作為評(píng)價(jià)指標(biāo)極小值(下限值),并以其上下限值作為評(píng)價(jià)對(duì)象評(píng)價(jià)指標(biāo)的極點(diǎn)值,見(jiàn)表1。
表1 我國(guó)湖泊營(yíng)養(yǎng)狀態(tài)評(píng)價(jià)標(biāo)準(zhǔn)及分級(jí)標(biāo)準(zhǔn)
2.2.1 數(shù)據(jù)的標(biāo)準(zhǔn)化處理
表1中湖泊營(yíng)養(yǎng)狀態(tài)評(píng)價(jià)指標(biāo)分為正向指標(biāo)和負(fù)向指標(biāo),為了消除不同量綱對(duì)評(píng)價(jià)結(jié)果的影響,首先需對(duì)評(píng)價(jià)指標(biāo)數(shù)據(jù)進(jìn)行標(biāo)準(zhǔn)化處理。對(duì)湖泊營(yíng)養(yǎng)狀態(tài)評(píng)價(jià)等級(jí)起正作用的指標(biāo),如葉綠素、總磷等,其處理方法為:
對(duì)湖泊營(yíng)養(yǎng)狀態(tài)評(píng)價(jià)等級(jí)起負(fù)作用的指標(biāo),如透明度,其處理方法為:
經(jīng)過(guò)標(biāo)準(zhǔn)化處理后,數(shù)據(jù)處于 [0~1]范圍,有利于網(wǎng)絡(luò)訓(xùn)練。
2.2.2 訓(xùn)練及測(cè)試樣本設(shè)計(jì)
依據(jù)表1,為不失一般性,采用隨機(jī)內(nèi)插的方法在各分級(jí)閾值間生成30個(gè)樣本,隨機(jī)選取20個(gè)作為訓(xùn)練樣本,10個(gè)作為測(cè)試樣本,以此計(jì)算共隨機(jī)內(nèi)插得到180個(gè)樣本,其中120個(gè)作為訓(xùn)練樣本,60個(gè)作為測(cè)試樣本。并用表2中的輸入、輸出對(duì)模型參數(shù)進(jìn)行率定。
表2 湖泊營(yíng)養(yǎng)狀態(tài)評(píng)價(jià)學(xué)習(xí)及檢驗(yàn)樣本及期望輸出
2.2.3 性能評(píng)價(jià)
本文選用的模型性能評(píng)價(jià)指標(biāo)有:平均相對(duì)誤差和最大相對(duì)誤差2個(gè)統(tǒng)計(jì)學(xué)指標(biāo),各評(píng)價(jià)指標(biāo)越小,表明模型的性能越好。各統(tǒng)計(jì)量的具體公式如下:
2.2.4 網(wǎng)絡(luò)訓(xùn)練
本文基于MATLAB環(huán)境,創(chuàng)建及訓(xùn)練LMBP、RBF 2種模型湖泊營(yíng)養(yǎng)狀態(tài)評(píng)價(jià)。LM-BP模型,由于隱含層節(jié)點(diǎn)數(shù)、期望誤差、訓(xùn)練次數(shù)、傳遞函數(shù)和訓(xùn)練函數(shù)等參數(shù)目前并沒(méi)有較理想的確定和選擇方法,主要是憑經(jīng)驗(yàn)確定和選取。對(duì)于RBF模型,人為調(diào)節(jié)的參數(shù)少,只有徑向基函數(shù)系數(shù)SPREAD,利用逐步增加或減小SPREAD取值的方法獲得具有最佳評(píng)價(jià)效果時(shí)的SPREAD值。經(jīng)反復(fù)調(diào)試,在下述參數(shù)設(shè)置條件下,LM-BP、RBF 2種模型具有較好的評(píng)價(jià)效果。
LM-BP模型:模型在結(jié)構(gòu)為5—10—1,隱含層和輸出層傳遞函數(shù)分別采用tansig和purelin,學(xué)習(xí)速率lr為0.01,設(shè)定期望誤差為0.0001,最大訓(xùn)練輪回為1000次時(shí)模型達(dá)到了較好的評(píng)價(jià)效果。
RBF模型:RBF模型在SPREAD為0.4時(shí)具有較好的評(píng)價(jià)效果。
LM-BP與RBF模型對(duì)訓(xùn)練樣本和檢驗(yàn)樣本評(píng)價(jià)精度比較結(jié)果見(jiàn)表3。
表3 LM-BP與RBF模型對(duì)訓(xùn)練及檢驗(yàn)樣本評(píng)價(jià)比較
從表3可以看出,LM-BP模型的訓(xùn)練樣本和檢驗(yàn)樣本的評(píng)價(jià) (擬合)精度明顯優(yōu)于RBF評(píng)價(jià)模型,因此本文采用LM-BP模型對(duì)麗江程海及瀘沽湖2008~2012年的營(yíng)養(yǎng)狀態(tài)進(jìn)行評(píng)價(jià)。
利用上述訓(xùn)練好的LM-BP湖泊營(yíng)養(yǎng)狀態(tài)評(píng)價(jià)模型對(duì)麗江程海及瀘沽湖2008年~2012年?duì)I養(yǎng)狀態(tài)進(jìn)行評(píng)價(jià),評(píng)價(jià)結(jié)果見(jiàn)表4。
表4 2008~2012年程海及瀘沽湖營(yíng)養(yǎng)狀態(tài)評(píng)價(jià)結(jié)果
根據(jù)表4可以得出以下結(jié)論:瀘沽湖LM-BP輸出值約在1~3,表明瀘沽湖營(yíng)養(yǎng)狀態(tài)處于貧營(yíng)養(yǎng)~中營(yíng)養(yǎng),營(yíng)養(yǎng)化程度有下降趨勢(shì);程海LMBP輸出值約在3~5,表明程海營(yíng)養(yǎng)狀態(tài)處于中營(yíng)養(yǎng)~富營(yíng)養(yǎng),營(yíng)養(yǎng)化程度同樣具有下降趨勢(shì)。從LM-BP輸出值與期望輸出值比較來(lái)看,最大相對(duì)誤差為2.85%,平均相對(duì)誤差為0.79%,LM-BP湖泊營(yíng)養(yǎng)狀態(tài)評(píng)價(jià)模型具有較好的泛化能力和評(píng)價(jià)精度,表明研究建立的LM-BP模型應(yīng)用于湖泊營(yíng)養(yǎng)狀態(tài)的評(píng)價(jià)是合理可行的,可為湖泊營(yíng)養(yǎng)狀態(tài)的評(píng)價(jià)提供新的途徑和方法。
本文針對(duì)標(biāo)準(zhǔn)梯度BP算法在實(shí)際應(yīng)用中存在著收斂速度較慢、易陷入局部極小值的不足,采用梯度下降法和牛頓法相結(jié)合的 Levenberg-Marquardt,提出LM-BP湖泊營(yíng)養(yǎng)狀態(tài)評(píng)價(jià)模型,并構(gòu)建RBF模型作為對(duì)比模型。鑒于模型訓(xùn)練樣本難以獲取的缺點(diǎn),利用隨機(jī)內(nèi)插的方法構(gòu)造網(wǎng)絡(luò)訓(xùn)練樣本和檢驗(yàn)樣本。在經(jīng)過(guò)一定次數(shù)的訓(xùn)練后,模型達(dá)到精度要求,訓(xùn)練及檢驗(yàn)結(jié)果表明,LM-BP模型評(píng)價(jià)精度優(yōu)于RBF模型。最后將訓(xùn)練好的LM-BP模型運(yùn)用于麗江程海及瀘沽湖營(yíng)養(yǎng)狀態(tài)的評(píng)價(jià),評(píng)價(jià)結(jié)果令人滿意。
[1]舒金華.我國(guó)主要湖泊富營(yíng)養(yǎng)化程度的評(píng)價(jià) [J].海洋與湖沼,1993,24(6):616-620.
[2]金菊良,王文圣,洪天求,等.流域水安全智能評(píng)價(jià)方法的理論基礎(chǔ)探討[J].水利學(xué)報(bào),2006,37(8):918-925.
[3]鄧大鵬,劉剛,李學(xué)德,等.基于神經(jīng)網(wǎng)絡(luò)簡(jiǎn)單集成的湖庫(kù)富營(yíng)養(yǎng)化綜合評(píng)價(jià)模型[J].生態(tài)學(xué)報(bào),2007,27(2):725-731.
[4]任黎,董增川,李少華.人工神經(jīng)網(wǎng)絡(luò)模型在太湖富營(yíng)養(yǎng)化評(píng)價(jià)中的應(yīng)用 [J].河海大學(xué)學(xué)報(bào) (自然科學(xué)版),2004,32(2):147-150.
[5]樓文高.湖庫(kù)富營(yíng)養(yǎng)化人工神經(jīng)網(wǎng)絡(luò)評(píng)價(jià)模型[J].水產(chǎn)學(xué)報(bào),2001,25(5):474-478.
[6]崔東文.基于BP神經(jīng)網(wǎng)絡(luò)的文山州水資源承載能力評(píng)價(jià)分析[J].長(zhǎng)江科學(xué)院報(bào),2012,29(5):9-15.
[7]崔東文.幾種神經(jīng)網(wǎng)絡(luò)模型在湖庫(kù)富營(yíng)養(yǎng)化程度評(píng)價(jià)中的應(yīng)用 [J].水資源保護(hù),2012,28(6):1-8.
[8]張德豐.MATLAB神經(jīng)網(wǎng)絡(luò)應(yīng)用設(shè)計(jì)[M].北京:機(jī)械工業(yè)出版社,2009.
[9]MATLAB中文論壇.MATLAB神經(jīng)網(wǎng)絡(luò)30個(gè)案例分析 [M].北京:北京航空航天大學(xué)出版社,2010.
[10]SL395-2007,地表水資源質(zhì)量評(píng)價(jià)技術(shù)規(guī)程 [S].
[11]王貴作,任立良,王斌,等.基于投影尋蹤的湖泊富營(yíng)養(yǎng)化程度評(píng)價(jià)模型[J].水資源保護(hù),2009,25(5):14-18.