陳廣銀, 蔡灝兢, 朱 奕, 夏 飛
(昆山市環(huán)境監(jiān)測(cè)站,江蘇 昆山 215300)
科學(xué)評(píng)價(jià)水質(zhì)狀況是環(huán)境管理的基礎(chǔ)。一些學(xué)者嘗試運(yùn)用新的方法評(píng)價(jià)水體,如灰色評(píng)價(jià)法、模糊數(shù)學(xué)法、主成分分析法、多元統(tǒng)計(jì)法、色聚類(lèi)法等[1-8],但這些方法多數(shù)需要設(shè)計(jì)各評(píng)價(jià)指標(biāo)對(duì)各級(jí)標(biāo)準(zhǔn)的隸屬函數(shù)及各指標(biāo)的權(quán)重,評(píng)價(jià)結(jié)果受主觀因素影響較大,限制了評(píng)價(jià)方法的通用性,也影響了結(jié)果的可靠性[9]。神經(jīng)網(wǎng)絡(luò)是20世紀(jì) 40年代產(chǎn)生、80年代發(fā)展起來(lái)的模擬人腦生物過(guò)程的人工智能技術(shù),特別適用于對(duì)因果關(guān)系復(fù)雜的非確定性推理、判斷、識(shí)別和分類(lèi)等問(wèn)題的處理,并被應(yīng)用在水質(zhì)評(píng)價(jià)中,如BP網(wǎng)絡(luò)模型、模糊神經(jīng)網(wǎng)絡(luò)模型,但這些模型學(xué)習(xí)速度慢,受初始值、權(quán)值等多種因素影響,易陷入局部最優(yōu)、重復(fù)性較差[10-13]。本文嘗試用廣義回歸神經(jīng)網(wǎng)絡(luò)評(píng)價(jià)水體水質(zhì),并和其它評(píng)價(jià)方法對(duì)比說(shuō)明其可行性。
廣義回歸神經(jīng)網(wǎng)絡(luò)(GRNN)是美國(guó)學(xué)者DonaldF·Specht在1991年提出的,是徑向基函數(shù)神經(jīng)網(wǎng)絡(luò)的一種特殊形式,用密度函數(shù)來(lái)預(yù)測(cè)輸出[14]。GRNN建立在非參數(shù)核回歸基礎(chǔ)上,樣本數(shù)據(jù)作為后驗(yàn)概率驗(yàn)證條件執(zhí)行Parzen非參數(shù)估計(jì),從樣本中計(jì)算自變量和因變量之間的聯(lián)合概率密度函數(shù),算出因變量對(duì)自變量的回歸值[15]。
假設(shè)x,y是兩個(gè)隨機(jī)變量,其聯(lián)合概率密度為f(x,y)。若已知x0,y相對(duì)于x的回歸為
(1)
對(duì)于未知的概率密度函數(shù)f(x,y),則可根據(jù)x和y的觀測(cè)樣本通過(guò)Parzen非參數(shù)估計(jì)得:
(2)
d(x0,xi)=(x0-xi)T(x0-xi)/2σ2
(3)
d(y0,yi)=(y0-yi)2/2σ2
(4)
將公式(2)、(3)、(4)代入式(1),交換積分與求和的順序得到式(5):
(5)
由于
(6)
化簡(jiǎn)上式可得:
(7)
式中:n為樣本容量;m為隨機(jī)變量x的維數(shù);σ為光滑因子,其為高斯函數(shù)的標(biāo)準(zhǔn)差。GRNN 神經(jīng)網(wǎng)絡(luò)的輸出數(shù)據(jù)和訓(xùn)練樣本的誤差主要由平滑因子決定的,只需調(diào)整平滑因子就可以獲得較好的全局性收斂模型[16]。
BP網(wǎng)絡(luò)分為輸入層、隱藏層和輸出層。輸入信號(hào)通過(guò)權(quán)值鏈接作用于隱藏層,隱藏層通過(guò)激活函數(shù)的非線性變換后計(jì)算得到輸出層,產(chǎn)生輸出信號(hào)。如果沒(méi)有得到期望輸出,則根據(jù)實(shí)際輸出與期望輸出的誤差偏差調(diào)整輸入層節(jié)點(diǎn)與隱藏層節(jié)點(diǎn)、隱藏層節(jié)點(diǎn)與輸出層節(jié)點(diǎn)之間的聯(lián)接權(quán)值及閾值,使誤差沿梯度下降方向,經(jīng)過(guò)反復(fù)迭代,當(dāng)實(shí)際輸出和期望輸出達(dá)到設(shè)定誤差時(shí)訓(xùn)練即告完成[12]。
訓(xùn)練數(shù)據(jù)來(lái)源于《地表水環(huán)境質(zhì)量標(biāo)準(zhǔn)》(GB 3838—2002),見(jiàn)表1,并用matlab R2013a中的linspace線性內(nèi)插法生成500組數(shù)據(jù)。待評(píng)價(jià)數(shù)據(jù)來(lái)源于Ⅲ類(lèi)功能水體的某湖泊采樣點(diǎn),采樣時(shí)間為2016年每月4日,連續(xù)12個(gè)月,監(jiān)測(cè)項(xiàng)目見(jiàn)表2。為了消除因變量及自變量量綱及濃度不同所帶來(lái)的影響,將原始數(shù)據(jù)進(jìn)行歸一化處理后作為網(wǎng)絡(luò)輸入和輸出,并將網(wǎng)絡(luò)評(píng)價(jià)結(jié)果進(jìn)行反歸一化得到實(shí)際評(píng)價(jià)結(jié)果。
表1 地表水環(huán)境質(zhì)量標(biāo)準(zhǔn)值Table 1 Surface water environment quality standard
表2 待評(píng)價(jià)水體水質(zhì)參數(shù)Table 2 Waterquality parameters for evaluation
通過(guò)MATLAB R2013a中的廣義回歸神經(jīng)網(wǎng)絡(luò)命令net=newgrnn(P,T,SPREAD)建立模型,其中SPREAD為光滑因子,訓(xùn)練時(shí)將光滑因子分別取值為0.4、0.6、0.8,并將Ⅰ、Ⅱ、Ⅲ、Ⅳ、Ⅴ類(lèi)水體標(biāo)準(zhǔn)值代入訓(xùn)練好的網(wǎng)絡(luò)模型進(jìn)行評(píng)價(jià),評(píng)價(jià)誤差如圖1。從圖中可以看出,當(dāng)光滑因子為0.8時(shí),模型評(píng)價(jià)誤差為2.1%~36%;當(dāng)光滑因子為0.4時(shí),5種水體的評(píng)價(jià)誤差在0.5%~4.7%,因此本文采用光滑因子為0.4時(shí)的模型。
圖1 光滑因子對(duì)評(píng)價(jià)結(jié)果的影響Fig.1 Smooth factor’s influence on the evaluation results
為了說(shuō)明本文所提出的廣義回歸神經(jīng)網(wǎng)絡(luò)的可行性,將其評(píng)價(jià)結(jié)果與比較成熟的BP神經(jīng)網(wǎng)絡(luò)的評(píng)價(jià)結(jié)果進(jìn)行比較,結(jié)果如圖2。
圖2 水質(zhì)評(píng)價(jià)結(jié)果Fig.2 The results of water quality evaluation
從圖2中發(fā)現(xiàn)GRNN與BP神經(jīng)網(wǎng)絡(luò)的水質(zhì)評(píng)價(jià)結(jié)果基本一致,GRNN和BP評(píng)價(jià)結(jié)果誤差為-0.4%~18.6%。兩種評(píng)價(jià)方法都表明一年中2、3月份的水質(zhì)最差,夏季的水質(zhì)評(píng)價(jià)較好,其中8月份最好。通過(guò)分析原始數(shù)據(jù)發(fā)現(xiàn)影響水質(zhì)的主要因素是TN,分析夏季水質(zhì)較好的原因可能為:8月份雨水較充沛,在一定程度上稀釋了水體;高溫天氣,企業(yè)停產(chǎn)停工較多,也在客觀上減少了水體TN的排入;水體溫度高,硝化、厭氧硝化較為活躍,加速水體中TN的去除。2、3月份水質(zhì)最差的原因一方面2、3月份溫度低,硝化、反硝化弱,導(dǎo)致水質(zhì)自凈能力差;另一方面,春節(jié)期間可能違法行為較多,污染物偷排量大。
單因子評(píng)價(jià)法是選取評(píng)價(jià)時(shí)段內(nèi)水質(zhì)最差的類(lèi)別為評(píng)價(jià)結(jié)果,是水質(zhì)評(píng)價(jià)使用最多的方法,能夠確定影響水質(zhì)類(lèi)別的關(guān)鍵因素[17]。本例中主要污染因子是TN,從而有利于提出針對(duì)性的水環(huán)境治理措施,但其評(píng)價(jià)結(jié)果過(guò)于悲觀。盡管其它污染指標(biāo)濃度很低,基本處于Ⅱ類(lèi)水標(biāo)準(zhǔn),但由于TN較高,導(dǎo)致所評(píng)價(jià)水體全部是Ⅴ類(lèi)或劣Ⅴ類(lèi),無(wú)法評(píng)價(jià)水質(zhì)的綜合狀況。
GRNN和BP通過(guò)對(duì)環(huán)境標(biāo)準(zhǔn)的學(xué)習(xí),自動(dòng)計(jì)算因子間的權(quán)重系數(shù),消除主觀誤差,兩者評(píng)價(jià)結(jié)果平均相對(duì)誤差為8.8%,說(shuō)明將廣義回歸神經(jīng)網(wǎng)絡(luò)用于水質(zhì)評(píng)價(jià)是可行的。GRNN及BP評(píng)價(jià)結(jié)果顯示,2、3月份水質(zhì)污染最嚴(yán)重,均超過(guò)水體功能區(qū)Ⅲ類(lèi)水的標(biāo)準(zhǔn),其余月份都符合Ⅲ類(lèi)功能。BP網(wǎng)絡(luò)訓(xùn)練時(shí)需要大量的數(shù)據(jù),模型參數(shù)多,易陷入局部最優(yōu),而GRNN只需調(diào)整模型平滑因子,為全局收斂。
GRNN與BP神經(jīng)網(wǎng)絡(luò)的水質(zhì)評(píng)價(jià)結(jié)果基本一致,其評(píng)價(jià)結(jié)果相對(duì)誤差-0.4%~18.6%,說(shuō)明了GRNN評(píng)價(jià)水質(zhì)的可行性。水質(zhì)評(píng)價(jià)結(jié)果表明,待評(píng)價(jià)水體水質(zhì)不容樂(lè)觀,剛好達(dá)到或者已經(jīng)超過(guò)功能區(qū)標(biāo)準(zhǔn)。一年中污染最重的是2、3月份,污染最輕的是8月份。應(yīng)該加大水體治理力度,特別是春節(jié)期間的 2、3月份,嚴(yán)查企業(yè)偷排行為,減少水體污染物的輸入。GRNN用于水質(zhì)評(píng)價(jià)時(shí)模型參數(shù)少、操作簡(jiǎn)單,通過(guò)對(duì)標(biāo)準(zhǔn)方法的學(xué)習(xí),自動(dòng)計(jì)算因子間的權(quán)重系數(shù),評(píng)價(jià)結(jié)果能夠綜合反映水質(zhì)狀況,有助于管理人員通過(guò)大量的監(jiān)測(cè)數(shù)據(jù)快速掌握不同水體的污染程度,為水資源管理提供重要的技術(shù)支持。