陳振宙,楊 旭,楊鵬輝,許文博,張 弛
(1.黑龍江大學(xué)水利電力學(xué)院,黑龍江 哈爾濱 150080;2.哈爾濱市磨盤山水庫(kù)管護(hù)中心,黑龍江 哈爾濱150080)
水是生命之源,在人類的生產(chǎn)、生活中起著重要作用。隨著人民生活水平不斷提高以及思想的不斷進(jìn)步,對(duì)水的開(kāi)發(fā)、利用以及保護(hù)的重視程度也顯著提高,因此水質(zhì)評(píng)價(jià)變得尤為重要。對(duì)水庫(kù)的水質(zhì)進(jìn)行評(píng)價(jià)分析可以了解水庫(kù)整體的水體質(zhì)量狀況,并為水庫(kù)水資源開(kāi)發(fā)、利用和保護(hù)提供技術(shù)支撐。
對(duì)水質(zhì)評(píng)價(jià)的方法大體上有單因子評(píng)價(jià)法、綜合指數(shù)評(píng)價(jià)法,模糊綜合評(píng)價(jià)法,主成分分析法,神經(jīng)網(wǎng)絡(luò)評(píng)價(jià)法等。徐春霞[1]等人用單因子法和綜合法對(duì)秦皇島地下水質(zhì)量進(jìn)行了評(píng)價(jià)。梅學(xué)彬[2]對(duì)以往的模糊綜合評(píng)價(jià)法中權(quán)重確定方法進(jìn)行了改進(jìn),并用實(shí)例分析其可行性。馬虹[3]用污染指數(shù)法和模糊數(shù)學(xué)法對(duì)哈爾濱醫(yī)藥集團(tuán)公司地面水進(jìn)行了評(píng)價(jià)。杜俊鵬[4]應(yīng)用主成分分析法對(duì)長(zhǎng)春市經(jīng)濟(jì)開(kāi)發(fā)區(qū)河流水質(zhì)進(jìn)行了評(píng)價(jià)。郭新強(qiáng)[5]運(yùn)用主成分分析法和綜合水質(zhì)標(biāo)識(shí)指數(shù)法對(duì)福建某濱海地水質(zhì)進(jìn)行評(píng)價(jià)。張怡[6]等人利用BP神經(jīng)網(wǎng)絡(luò)模型對(duì)大慶市紅旗泡水庫(kù)進(jìn)行水質(zhì)的富營(yíng)養(yǎng)化評(píng)價(jià)。許燕穎[7]利用BP神經(jīng)網(wǎng)絡(luò)和WPI評(píng)價(jià)法評(píng)價(jià)了桃江水質(zhì)。本文以主成分分析法以及RBF神經(jīng)網(wǎng)絡(luò)法對(duì)磨盤山水庫(kù)水質(zhì)進(jìn)行評(píng)價(jià)。
磨盤山水庫(kù)位于五常市境內(nèi)松花江一級(jí)支流,距離哈爾濱市約180 km,水源流域面積為1151 km2,多年平均徑流量為5.75×108m3,是一座以城鎮(zhèn)供水,農(nóng)田灌溉為主,兼顧防洪,發(fā)電的綜合利用水利樞紐工程[8]。
本文以2022年12個(gè)月的磨盤山水庫(kù)監(jiān)測(cè)數(shù)據(jù)為依據(jù),選取溶解氧(DO),氨氮(NH3-N),化學(xué)需氧量(COD),總磷(TP),總氮(TN)的5個(gè)指標(biāo),按照地表水環(huán)境質(zhì)量標(biāo)準(zhǔn)(GB 3838-2002)[9]中的對(duì)應(yīng)標(biāo)準(zhǔn)限值,對(duì)水質(zhì)進(jìn)行評(píng)價(jià)。
由于水質(zhì)指標(biāo)有不同量綱以及數(shù)量級(jí),故在評(píng)價(jià)前先進(jìn)行數(shù)據(jù)的無(wú)量綱化處理。
式中:tij為第i個(gè)評(píng)價(jià)對(duì)象的第j個(gè)指標(biāo);、Cj分別是第j個(gè)指標(biāo)的樣本均值和樣本標(biāo)準(zhǔn)差,i=1,2,…,5, j=1,2,…12。
處理結(jié)果見(jiàn)表1。
由表2可知,氨氮與COD,總氮之間存在正相關(guān),COD與總氮存在正相關(guān),本文大多數(shù)指標(biāo)存在較強(qiáng)的相關(guān)性,適合應(yīng)用主成分分析法進(jìn)行水質(zhì)評(píng)價(jià)。
表2 水質(zhì)指標(biāo)間的pearson相關(guān)分析
從表3可知,KMO=0.618>0.6,Sig.=0.000<0.05,各水質(zhì)指標(biāo)間存在較強(qiáng)的相關(guān)性,運(yùn)用主成分分析進(jìn)行水質(zhì)評(píng)價(jià)可以得到較為理想的結(jié)果。
表3 KMO與巴特利特校驗(yàn)
將方差解釋中特征值大于1且累計(jì)方差貢獻(xiàn)率大于85%為標(biāo)準(zhǔn)確定為主成分。
建立主成分得分表達(dá)式,見(jiàn)式(2)。其中,表示主成分中各變量的權(quán)重,可以基于式(3)建立得分系數(shù)矩陣。
式中:F為綜合得分;Cj為第i個(gè)主成分的方差貢獻(xiàn)率。
由表4可知成分1和成分2的特征值分別為3.383和1.054,對(duì)應(yīng)的方差平方和分別為67.656%,19.071%。成分1和成分2的特征值均大于1,而且累計(jì)方差平方和高達(dá)86.728%,表明前兩個(gè)成分可以解釋數(shù)據(jù)的86.728%的信息,因此,可以選擇成分1、成分2作為主成分進(jìn)行水質(zhì)評(píng)價(jià)。
表5為成分矩陣,主要反映各個(gè)水質(zhì)指標(biāo)在主成分1和主成分2上荷載的分布情況,由表4和表5綜合分析可得,主成分1的貢獻(xiàn)率為67.656%,COD、氨氮、總氮、總磷在主成分1中占有較高的載荷,表明主成分1對(duì)水質(zhì)狀況的影響較大,且主要反映水庫(kù)受有機(jī)物污染。
表5 成分矩陣
由表6可得出主成分1和主成分2的表達(dá)式分別為:
表6 得分系數(shù)矩陣
基于式 (4)(5)(6),計(jì)算出磨盤山水庫(kù)1月~12月與地表水環(huán)境質(zhì)量標(biāo)準(zhǔn)中規(guī)定的五類水質(zhì)的綜合得分,并基于地表水環(huán)境質(zhì)量標(biāo)準(zhǔn)中五類水質(zhì)的綜合得分判定水庫(kù)各月份的水體質(zhì)量狀況。從表7中可以看出,基于主成分分析法清晰的反映出水庫(kù)各月份的水體質(zhì)量狀況:水質(zhì)達(dá)到Ⅰ類水標(biāo)準(zhǔn)有1月、2月、3月、4月、6月,共5個(gè)月;5月、7月、8月、9月、10月、11月、12月水質(zhì)狀況均為Ⅱ類。
表7 主成分分析水質(zhì)評(píng)價(jià)結(jié)果匯總
RBF神經(jīng)網(wǎng)絡(luò)的核心是函數(shù)逼近理論,是一種具有較強(qiáng)全局能力的前饋式神經(jīng)網(wǎng)絡(luò)。RBF神經(jīng)網(wǎng)絡(luò)主要由輸入層(input),輸出層(output)以及隱含層(implicit layer)三部分組成。結(jié)構(gòu)見(jiàn)圖1。
圖1 RBF神經(jīng)網(wǎng)絡(luò)示意圖
以RBF網(wǎng)絡(luò)建立水質(zhì)評(píng)價(jià)模型,網(wǎng)絡(luò)的輸入x為某水樣中參與評(píng)價(jià)的種水質(zhì)指標(biāo)實(shí)測(cè)值的集合,輸出為該水樣的水質(zhì)級(jí)別。同其它所有利用RBF網(wǎng)絡(luò)解決問(wèn)題一樣,問(wèn)題的關(guān)鍵集中在網(wǎng)絡(luò)結(jié)構(gòu)的選擇、可調(diào)參數(shù)的優(yōu)化方法、學(xué)習(xí)樣本的代表性上。
典型的RBF網(wǎng)絡(luò)中有3個(gè)可調(diào)參數(shù):隱含層基函數(shù)中心t、方差σ,以及輸出單元的權(quán)值ω。
本文用聚類方法選擇基函數(shù),可以各聚類中心作為基函數(shù)中心,而以各類樣本的方差的某一函數(shù)作為各個(gè)基函數(shù)的寬度參數(shù)。隱含層到輸出層的權(quán)值用最小二乘法求得,分級(jí)聚類可以看成是將N個(gè)樣本劃分成c個(gè)類的劃分序列。第一個(gè)劃分是把樣本分成N個(gè)類,每類包含一個(gè)樣本;第二個(gè)劃分是把樣本分成N-1個(gè)類,依此類推,直到第N個(gè)劃分時(shí)把樣本僅分成一個(gè)類。如果類數(shù)c=N-K+1,則稱這個(gè)劃分處于K水平。這種劃分序列具有如下性質(zhì):只要在K水平時(shí)樣本被歸入同一類后,在進(jìn)行更高水平的劃分時(shí),它們也永遠(yuǎn)屬于同一類。這種分類方法較穩(wěn)定,只要確定了類數(shù),分類結(jié)果就是唯一的[10,11]。
訓(xùn)練樣本一般為實(shí)測(cè)的或通過(guò)計(jì)算得到的一系列一一對(duì)應(yīng)的(x,y), x為輸入,y為輸出。然而對(duì)于水質(zhì)評(píng)價(jià),目的就是根據(jù)一定的水質(zhì)判別標(biāo)準(zhǔn)建立一種評(píng)價(jià)方法,從而對(duì)水質(zhì)的優(yōu)劣做出合理的評(píng)價(jià)。這樣就不能通過(guò)前述兩種方法獲取訓(xùn)練樣本,因?yàn)閷?shí)測(cè)數(shù)據(jù)只有水質(zhì)指標(biāo)的數(shù)值,沒(méi)有對(duì)應(yīng)的水質(zhì)級(jí)別;如果通過(guò)某種方法計(jì)算得到一系列輸入x對(duì)應(yīng)的輸出y值,經(jīng)過(guò)神經(jīng)網(wǎng)絡(luò)學(xué)習(xí)后得到的網(wǎng)絡(luò)結(jié)構(gòu)就變成對(duì)這種方法的模仿,那就失去了應(yīng)用神經(jīng)網(wǎng)絡(luò)進(jìn)行評(píng)價(jià)的意義。所以對(duì)于水質(zhì)評(píng)價(jià)訓(xùn)練樣本數(shù)據(jù)只能從水質(zhì)標(biāo)準(zhǔn)中獲取[10]。
以地面水環(huán)境質(zhì)量標(biāo)準(zhǔn)為例,首先隨機(jī)產(chǎn)生一個(gè)1~5之間的整數(shù),1代表水質(zhì)類別為Ⅰ類,2代表水質(zhì)類別為Ⅱ類,依此類推,5代表水質(zhì)指標(biāo)為Ⅴ類水標(biāo)準(zhǔn)。然后根據(jù)水環(huán)境質(zhì)量標(biāo)準(zhǔn)在該水質(zhì)類別的范圍為各水質(zhì)指標(biāo)隨機(jī)產(chǎn)生數(shù)值。
3.3.1 數(shù)據(jù)標(biāo)準(zhǔn)化處理
使用MATLAB的zscore函數(shù)對(duì)訓(xùn)練數(shù)據(jù)進(jìn)行標(biāo)準(zhǔn)化處理,以便每個(gè)特征的均值為0,方差為1。z-score 標(biāo)準(zhǔn)化(正太標(biāo)準(zhǔn)化)是基于原始數(shù)據(jù)的均值(mean)和標(biāo)準(zhǔn)差(standard deviation)進(jìn)行數(shù)據(jù)的標(biāo)準(zhǔn)化。將原始值x使用z-score標(biāo)準(zhǔn)化到x'。
3.3.2 建立訓(xùn)練模型及預(yù)測(cè)
本文使用MATLAB的newrb函數(shù)訓(xùn)練了一個(gè)RBF神經(jīng)網(wǎng)絡(luò),訓(xùn)練輸出為trainY。我們對(duì)trainY進(jìn)行了四舍五入操作,以便將其轉(zhuǎn)換為整數(shù)類型的標(biāo)簽trainPred。然后,我們計(jì)算了訓(xùn)練準(zhǔn)確率trainAcc、平均絕對(duì)誤差trainMae、均方根誤差trainRmse和F1分?jǐn)?shù)trainF1。
最后,使用訓(xùn)練好的RBF神經(jīng)網(wǎng)絡(luò)對(duì)測(cè)試數(shù)據(jù)進(jìn)行預(yù)測(cè),得到測(cè)試輸出testY。我們對(duì)testY進(jìn)行了四舍五入操作,以便將其轉(zhuǎn)換為整數(shù)類型的標(biāo)簽testPred。然后計(jì)算測(cè)試準(zhǔn)確率testAcc、平均絕對(duì)誤差testMae、均方根誤差testRmse和F1分?jǐn)?shù)testF1。
3.3.3 評(píng)價(jià)結(jié)果
利用上述模型進(jìn)行評(píng)價(jià),結(jié)果見(jiàn)表8。從表8中可以看出,基于主成分分析法清晰的反映出水庫(kù)各月份的水體質(zhì)量狀況:水質(zhì)達(dá)到Ⅰ類水標(biāo)準(zhǔn)有1月、3月、4月、6月、7月共5個(gè)月;2月、5月、8月、9月、10月、11月、12月水質(zhì)狀況均為Ⅱ類。
表8 RBF神經(jīng)網(wǎng)絡(luò)水質(zhì)評(píng)價(jià)結(jié)果匯總
由表7和表8分析可知,兩種方法在2月份以及7月份出現(xiàn)差異,造成此差異的原因在于兩者在評(píng)價(jià)過(guò)程中側(cè)重點(diǎn)不太一致。主成分分析法可以真實(shí)客觀地分析當(dāng)?shù)厮畮?kù)水質(zhì),為水庫(kù)改進(jìn)完善提供一定參考。RBF神經(jīng)網(wǎng)絡(luò)只需要按照水質(zhì)的各個(gè)分級(jí)標(biāo)準(zhǔn)傳造出所需的訓(xùn)練樣本,用訓(xùn)練完善的計(jì)算模型進(jìn)行水質(zhì)評(píng)價(jià)比較容易。該方法簡(jiǎn)單,具有很好的實(shí)用性。兩種方法評(píng)價(jià)結(jié)果與實(shí)際結(jié)果相差不大,此研究可用作其他地區(qū)參考。
本文應(yīng)用兩種評(píng)價(jià)方法對(duì)磨盤山水庫(kù)進(jìn)行了水質(zhì)評(píng)價(jià)并對(duì)結(jié)果進(jìn)行了比較,結(jié)果表明:
(1)主成分分析法相比于RBF神經(jīng)網(wǎng)絡(luò)評(píng)價(jià)法可以直觀地反映水庫(kù)水質(zhì)問(wèn)題,為水庫(kù)改善提供一定參考。
(2)RBF神經(jīng)網(wǎng)絡(luò)創(chuàng)建訓(xùn)練樣本較為簡(jiǎn)單,用訓(xùn)練完善的樣本進(jìn)行評(píng)價(jià),結(jié)果更為準(zhǔn)確,實(shí)用性也更好。
(3)水環(huán)境情況比較復(fù)雜多變,其評(píng)價(jià)方法種類豐富,因而評(píng)價(jià)結(jié)果也不盡相同。故需按照自身需求,結(jié)合當(dāng)?shù)厍闆r,有針對(duì)性地選擇方法對(duì)水質(zhì)進(jìn)行評(píng)價(jià)。